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緒論槪率論的性质 

1.背 景 

槪率論是一門数学学科，它与几何学或分析力学等学科有很 
相似的目标.对每一門学科都必須仔細地去区分理論的三个方 
面： （ a ) 形式邏輯的內容； （ b ) 直观的 背景； （ C ) 应用.不按这三方 
面之間的固有关系去考虑这三方面 5 就不能正确估計其全部結构 
的特性和优点. 

( a ) 形式邏輯的内容. 公理化的数学只論及某些无定义的 
事物之間的关系.这一点可以用下象棋来作很好的說明.要想描 
述象棋，除了陈述一蛆下棋規則外，不可能給象棋下一个“定义”. 
尽管对棋子的通常的形式可以作某种程度的描写，但哪一个是 
“王”棋不一定总是很清楚的.棋盘和棋子是有用的，但沒有它們 
仍然可以下棋.重要的事情在于了解棋手的走法与作用，也就是 
要了解一組棋規.要問象棋中的一个“卒”或“王”的“定义”或“精 
确的本性”是什么，这是沒有意义的.与此类似，在几何学中我們 
也不去过問点和直綫到底是什么.点和直綫是无定义的槪念，而 
几何公理規定它們之間的一些关系，例如，二点确定一直綫等等. 
这些就是規則，它們无异議地被承訊.我們可以改变公理系統而 
去硏究不同形式的几何，而且各种非欧几何的邏輯結构不依賴它 
們对現实的关系.物理学家曾硏究，在不同于牛頓的万有引力定 
律时，物体如何运动，这种硏究也是有意义的，卽使牛頓的万有引 
力定律是正确的. 

( b ) 直艰的背景. 与象棋对比，儿何学和力学的公理反映了 
客观存在着的直覌背景.事实上，几何的直覌性是如此之強，以 
致它常常会跑在邏輯推理的前面.邏輯、直戏与实际經驗三者之 



間的相互依賴性达到怎样的高度，这是一个間題，我們不需要去討 
論.当然，人們的直覌能力是可以鍛炼和发展的.例如，下象棋 
时，初学者小心翼翼地走棋，还要想一想各別的下棋規則 d 旦是，有 
經驗的棋手在一瞥之下就能掌握复杂的情況，对他的直覌往往不 
能用理由来解释.同样，数学直規随着經驗增加，人們有可能，例 
如說对于4維空間发展一种自然威覚. 

甚至人类的集体直覌能力也在进歩着.牛頓的力場槪念、起 
® 作用的慨念、馬克司威尔 ( Maxwell ) 关于电磁“波”的槪念，起初 
都被孰为是“不能設想的”和“违反直覌的近代工艺学和每家都 
有一架无綫电，使得这些槪念普及化而成为一些通常的語汇.同 
样，現在的学生不会体会到，当槪率論还在萌芽的时候，与某些思 
維方式、偏見及其它困难的斗爭情形.現在，报紙报导着民意測驗 
的样本，統計的影响已經渗透到生活的各个方面.于是对于象这 
样的 陈述： “这个事件的机会是五分之三”，人人都有了直規的威 
覚.这虽然是很模糊,但此直观足够作为槪率論入門的指南和背 
景.随着理論的发展，以及接触到一些更为微妙的应用，这个直覌 
还要得到发展. 

( c ) 应用. 应用几何学和力学的槪念时，要把它們与某些物 
理对象等同起来，但是这个結合过程是如此的灵活及变化无常，以 
致不能給出普遍的法則来.刚体这个槪念是基本的而且是有用的 
槪念，虽然沒有一个物理对象眞正具备它的条件.哪些物体能当 
作刚性的来处理，要視所处环境和所需要的近似度来决定.橡皮当 
然不是刚体，但是在討論汽車的运动的时候，許多教科书是把橡皮 
輪胎当作刚体来处理的.按照理論的目的，我們不管物貭的原子 
結构，而有时把太阳当作一个連續物貭的大球来处理，有时又把它 
当作一个貭点来处理. 

在应用中，抽象的数学模型只是当作工具来使用，而对同一实 
际場合可以采用不同的模型来 描述. 

f 警孝平枣巧亭旱；它是一个有目的 “ Ai，ifi 

4 得硏究这些技术的哲学分析，但它不属于数学、 




物 理学或 統計学范围以內.因此,必須把关于槪率 基础的 哲学从 
数学和統計学中分离出去，犹如关于直覌空間槪念的討論，現在 B 
經从几何学中分离出去一样. 

2.程 序 

槪率論的历史(一般数学史亦然）呈現出理論和应用的相互促 
进 作用： 理論的进展幵辟了应用的新領域，反过来每一个新的应 
用又产生出新的理論問題和有成果的硏究.目下槪率論已应用到 
很多不同的領域，而我們所要求的是一个普遍性理論所具有的那 
种伸縮性，以便对广泛的种神需要提供恰当的工具.因此我們必 
須反对下述企图（与趋向）：把理論、它的术語以及它的武器建立 
得过分接近于某一特殊兴趣范围.我們所要作的絕非如此，而是 
按照在几何学和力学中 E 經証明为十分成功的方式来发展出一种 
数学理論. 

我們先从扔錢币和擲殺子等最簡单的实驗出发，在这些場 
合，所有的陈述都有着明显的直艰意义.我們把这个直現性翻譯 
成一个抽象的模型，然后把这模型加以推广，使它能够适用于更复 
杂的場合.书中的实例是用来闡明几种模型的經驗背景和启发讀 
者的直規能力的，但理論本身还是数学性貭的.我們不拟力求解 
释槪率的“眞正意义”，正如近代物理学家不致力于闡明貭量和能 
的“实在意义”；几何学家不致力于解释点的性貭那样.我們将要 
做的，就是証明一些定理，幷指出这些定理怎样应用 • 

最初，槪率論的目的是描述有关机会游戏的經驗这一窄狹的 
領域，这时，主要目标只是要把某些槪 率計算 出来.在开始的几章 
里，我們也还計算一些典型的槪率，但是，要記住数値的槪率不是 
理論的主要对象.其目的在于发現一般的規律幷构造出满意的理 


論模型. 

槪率对我們所起的作用正如貭量在力学中所起的 作用. 在力 
学上，卽使不知道个別行星的貭量，不去思考实际上測量这些貭量 
的方法，也照样可以討論行星体系的 运动. 甚至虛构的行星体系 



也可以作为一个有益的、有启发的硏究对象.类似地，一些李哮巧 

ibkmim ' iiiis 4 A 簡单的槪率論模型 
来考虑时，对其中各种可能的系統都需作比較.理論上的最优系 
統被建立起来了，而其佘的系統也就不存在了.在保险业中，槪率 
論用来計算毁灭槪率，就是說用这理論来避免某些不期望发生的 
情形，因此，它应用到一些实际上观察不到的情形，卽使連一个数 
値都不能得到时，槪率論仍然是有效的和有用的. 

3. “統計”槪率 

近代数学槪率論的成就是有代价的，那就是把理論局限在“机 
会”的某一个特殊方面.槪率的直观槪念联系到归納推理，以及象 
下面的—些判断：“保尔大槪是一个幸运的 人”; “这本书大槪是一 
部失敗之 作”； “費馬 （ Fermat ) 的猜測大槪是不正确的”.这类判断 
受到哲学家和邏輯学家的注意，也是数学理論⑴的正确对象.然而 
必須这样了解，我們所关心的不是归納推理的型态，而是一种可以 
叫作是智;學宇或者莽 | HfE 宇的事物.粗略地来解释一下这句話 
的意思，这' 样說： _我'們'所 k 的槪率不是关于这些判断，而是关 
于一个學 f 寧攀的可能結果.在我們談到槪率之前，大家必須先 
承孰一个想实驗的想象模型，譬如說扔錢市；覌察扩散中一 
个 貭点； 記录电話呼喚的次数.一幵始就須承孰什么是这个理想 
实驗所有的可能結果（卽“亭乎李-，’)以及节們的槪率.这个程序 
可以在力学里找到类似情_在*力学里引进了包含着 2 个 ， 3 个 
或17个貭点的臆想模型，其中貭点幷沒有任何特性.同样，如果 
我們来分析扔錢币的实驗，我們理論的对象只是象“正面，正面，背 
面，正面，……”这些記号的序列，而不关心实际实驗的偶然情抚. 
在这个体系里，象什么“明天出太阳的槪率是多少”是不在考察之 
列的.假使我們要討論这个槪率，我們势必先来确定一个实驗的 
(理想)模型，而这个实驗不免要說成“从无穷多个世界中任意地选 
取一个…”.造这样一个模型其实也不需要多大的想象力，但是 





这样做是无聊而且毫无意义的. 

天丈学家談論太阳中心温度的測量，和到天狼星的旅行， 
这些似乎是不能办到的，但是作这种思考幷不是沒有意义的.同 
理，我們也不去忧虑理想的实驗能否实行；我們将要从事于分析抽 
象的模型.在我們的思想深处，保持着槪率的一个直观解释，达种 
解释在某些应用中获得实施的意义. 我們辱 季把实驗重复做很多 
次.槪率为 0.6 的事件終久可以期望在 lo 3 i 里出現60次.这 
句話是有意地含糊其詞的，但是，对于較为初等的应用来說，它提 
供了一个足够形象的直观背景.随着理論更精深的发展，实用意 
义和直观图象就变得更具体了. 

4.摘 要 

我們将要考虑一些理論模型，在这些模型中，槪率象力学中的 
貭量一样，是作为一些自由参数而出現的.可以用各种各样不同 
的方法来应用它們，应用的技巧和直覌能力随着理論的发展而发 

展. 

这是其它数学学科中所采用的富有成效的标准手法.沒有其 
它的手法可以滿足正在发展着的槪率論及其应用的各个分支的各 
种各样的需要. 

使我們惋惜的是，直观的槪率不能充分滿足科学的需要,但是 
这是一个历史事实.在第一章例 （6. b ) 中，我們将要討論多个貭点 
在多个盒里随机分布的問題.适当的或者“自然”的漑率分布对每 
个人来說似乎是完全淸楚的，幷且可以被物理学家毫无犹豫地接 
受.然而，事情是这样，物理貭点是沒有經过人类常識的訓拣，而 
“自然”（或波茨曼 ( Boltzmann 〉) 分布有时必須代以爱因斯坦-波司 
( Einstein - Bose ) 分布，有时又必須代以弗米-迪拉克 ( Fermi - Dirac ) 
分布.直覌論証不能說明为什么光子不同于貭子，为什么它們不 
遵从一个“預先給定”的規律.如果現在能找到一种論証,那也只 
能說明直覌槪念和理論一起发展罢了.无論如何，卽使对应用来 
說，自由和灵话都是重要的，而且把理論局限在一个固定的范畴 



里是不利的. 

有人叫嚷現代槪率論是如此抽象和如此普遍化，以至难于应 
用.这是只餅实用的人們当初曾經反对馬克司威尔場論的桃战口 
吻.这个論点可以为下列事实所 駿倒： 抽象的随机过程理論提供 
了一些新的未曾想象过的 应用； 現代的起伏理論所提供的新的知 
■又一次地与直覌想法相违背，幷且使人們去修正对实际的态度. 
然而，这种辯論是沒有什么用处的，在昨天还孰为是不合实际的东 
西今天就是实际的东西了，而明天将要成为理論的又被今天的实 
用的人們孰为是毫无价値的游戏， 

5.历史小記 

对槪率的統計或經驗现点主要是由馮 * 米賽斯 ( R . VonMises ) 
和費歇 ( R . A . Fisher ) 发展的.样本空間的槪念是由馮 • 米赛斯 [2] 
引进的.这个槪念使掲有可能把槪率的严格的数学理論建立在測 
度論上.在本世紀二+年代中，在許多作家的影响下，槪率論的測 
度論方法逐漸形成.現代槪率的公理化处理，是由柯尔莫格洛夫 
( A . H . KojmoropoB ) [3] 給出的.我們将沿着这一綫索进行討論，但 
是，由于这一卷只討論离散槪率的簡单情形，公理化系統这个名詞 
就显得太严謹了. 



第一章样本空間 

1.經驗背景 

槪率論的数学理論，从它和許多实际的和理想的实驗的关系 
上，获得了实用的价値，也获得了直观的意义.实际的和理想的实 
驗,例 如有： 扔一次錢币（鎳币）；扔一百次 錢市； 梛三顆 散子; 理一 
付紙牌;用两付紙牌对点;玩輪 盘賭； 观察放射性原子的寿命或覌 
察人的 寿命; 选取人为随机样本而观察其中慣用左手的 人数; 交配 
两种作物而規察它們后代的遺传型，或者槪率論的数学理論，从‘它 
和一些現象的关系上，获得了实用的价値，也获得了直覌的意义. 
一些現象，例如有：初生孩的性別；电話站中被占用的通話綫的数 
目；电話的呼喚次数;在电訊系統里面的随机噪声；生产过程的例 
行貭量 控制; 意外事故的 頻率; 天空某一区域內双星的 个数； 在扩 
散过程中一个貭点的位置.上列各項描述是含糊一点，要使槪率 
論有意义，我們必須对所探討的实驗或观察的可能結果究竟是指 
什么而言取得一致的意 . 

扔錢币掉下时不一定是正面或反面；它可能是滚掉了，也可能 
是笔直地站着.但是我們只承訊正面和背面是扔錢以后仅有的可 
能結果.这样一来，理論要簡洁得多了，间时也不影响其应用.这 
种类型的理想化是标准的办法.測定一个原子的寿命或一个人的 
寿命而沒有誤差是不可能的，但是为了理論上的目的，我們不妨設 
想寿命是实实在在的一个数.問題发 生了： 确实能代表一个人的 
寿命的是些什么数値呢？有沒有生命不可逾越的最大年龄？是否 
—切年龄都是可以設想的呢？一方面，誰也不孰为人能活到一千 
岁；另一方面，現时通行的保险业务对于人的可能寿命却不加任何 
上限.按照某些公式（死亡率表的現代制作法就是以达些公式为 



基础的）算出来，千年不苑的人在全人类中大約只占10#分之一， 
10’ 这个数共含有 10 27 兆个零.这句話，从生物学或 ft 会学的角 
度看来，固然是毫无意义的，但是单純从統計上着眼，沱和經驗当 
然沒有什么矛盾.因为一世紀內出生的人数还不到 10 w . 要想用 
統計来考驗上述說法，就需要10 11)35 个世紀以上的一段时間，而这 
段时間比地球的寿命的 10 10 ® 1 倍还要大得多.毫无疑問，这样小的 
槪率和我們心目中的“不可能性”是沒有什么矛盾的.你也許孰 
为，这种小槪率的使用本身就是荒謬絕伦的.其实不然，使用这种 
小槪率非但沒有坏处，而且还可以簡化公式.再說，如果我們眞的 
把活一千年的可能性排除掉，我們势必承孰一个最大年龄限 X 存 
在，說人能活 X 年而不能活 X 年零两秒，这神說法决不会比无限寿 
命的說法更能耕得通些. 

任何理論都必然含有理想化,对于我們来說，第一个理想化是 
关于实驗或观察的可能結果.如果我們要为实驗制作一个抽象模 
型，我們必須一开始就作出 决定： 这实驗的可能結果是由哪些东 
西构成的. 

为了統一术語起見，我們把实驗或覌察的結果叫做亨作.这 
样一来，我們就可以談論“扔5个錢币至少出現3个正面”的'事件. 
同样，分桥牌 1 >的“实驗”，其結果可以是“北家拿到2张爱司 （ ace )” 
的“事件一个样本的成分（例如“85人組成的样本中2个慣用 
左手”）和一个測量的結果(例如“温度120°”，“7条电話綫占用”） 
也都叫作事件. 

我們要区分复合（或可分解的）事件和簡单(或不可分解的)事 
件.例如，要是擲二个殺子使“总和为6”，那就是使成为“（1， 5) 或 
(2, 4) 或 （3, 3) 或（4, 2) 或 (5, 1)”，而这个事例把“总和为6” 的 


1) 一付桥牌共 52 张，分 4 种花色，毎种花色有〖 3 张.每一 

L •个 •不 •同•的面値 ： 2, 3,… ， 10, “賈克 "( jack ), “坤” ( queen ) 老开" 
( king ), “ 爱司” ( ace ). *1 种花色称为黑桃、梅花、釭心、方块，前两种是黑色的而 
后两种是&色的.同面値的牌称为同点.所謂玩桥牌，就是把整付牌分发給4 
家，这四家称为“东” 、“南 ”、“围”、“北”，每家备得 B 张，至于玩扑克的意义是: 
从一付牌里每家备取5张，进行組合. 



事件分解成五个簡单事件.同样，“两个奇数点”事件就分解为 
“（1,1)或（1，3)或……或(5, 5)” 九个簡单事件. 注意： 如果铘出 
的結果是（3, 3)，那么，这个結果旣包含在事件“和为6点”又包含 
在事件“二个奇数点”之內；而这两个事件不是互斥的，它們可以同 
时 发生.作为第二个例子，我們来考虑人的寿命.每一个 特殊数 
値 x 代表一个簡单事件，“此人50多岁”代表 * 在50到 6 <3这一事 
件.用这种办法，每一个复合事件都可以分解为一些簡单事件，也 
就是說，每一个复合事件是一些簡单事件的集合. 

如果要在理論上很明确地討論“实驗”或者“覌寮”，必須首先 
約定： 簡单事件代表可以想象的結果，它們确定理想的“实驗”. 

习慣上，这些簡单事件叫作样本点，或干脆就叫“点”.由定义得 

• • • • 

知： （理想)实驗的每一个不可分解的結果可用一个且只能用 — 个 

样本点来表示.所有这些样本点的全体称之为样本空間.于是， 

♦ • • • 

牵涉到給定的（理想)实驗的一切事件，都可以用样本点来表达. 

在把这些基本的約定形式化以前，我們討論几个以后常要用 
到的例子. 

2.实 例 

( a ) 三个球在三个盒中的分布. 表 1 列出了三个球放入三 

个盒中的全部可能結果. 

表1 


1. {abc 1 — 

1一} 

10. {a I bc \ — } 

19. {— 


2. { — \ abc \ — } 

11. 

{ b [a c \—} 

20. {— 

1 b 

3. { — | - 

J abc ) 

12. 

{ 1 — } 

21.( — 

1 ^ 

4. {ab | c 

1—} 

13. 

{a | — | be ) 

22. {a 

]b 

5. {a c \ b 

]-} 

H . 

{ 丨 一1“} 

23 . {a 

1 c 

6. { bc\a 

1-} 

15. 

{ c \ — [ab } 

2^. { b 

I « 

.7. {ab | — 

1 

16. 

{ — \ab J c } 

25. { b 

1 c 

8. {^2 c \ — 

1 b } 

17. 

{^\a c \ b } 

26. { r 

la 

9. { bc \ — 

|fl } 

18. 

{ 一丨 bc\a } 

27. { c 

1 b 


其中每一个排列都代表一个簡单事件，卽是一个样本点. 


• 9 • 






件“在一个盒內放一个球以上”为第1到第21个悱列的总体， 
我們說事件 Z 是由第1到第21个样本点所构成的集合.类似地， 
事件 B : “第一个盒是不空的”是第1，第4到第15,第22到第27 
这几个样本点构成的集合.事件 C : “ Z 和 S 都发生”是由第1,第 
4到第15共13个样本点构成的集合.在这个特例中，27个样本 
点中的每一个都或者属于 j 或者属于 S (或者旣属于 j 又属于 
因此，事件“或者/或者 F 或者二者都发生”就是样本空間，因此它 
必然发生.事件 /): 不发生”是由第22到第27个这六个样本 

点所构成，它可以用下述条件来 描述： 沒有一个盒是空的. 事件： 
“第一个盒是空的而其它的盒沒有放一个球以上”是不可能发生 
的，因为沒有一个样本点能满足这些条件. 

( b ) r 个球在 n 个盒中的分布. 对于 r 个球分布在》个盒 
中的一般情形完全可以用类似的办法来进行硏究，只不过这时的 
排列的个数随》■和》的增加而增力 U . 当» = 3, r = 4时，样本空 
間由81个样本点构成，当 r = « = 10时，样本空間共有 10 1D 个 
样本点；而造一个完整的表就要有約+万卷篇幅. 

我們用上面这个例子来說明一个重要的 事实： 卽是样本点的 
性貭和我們的理論是无关的.对于我們来說，样本空間 （ 与在其中 
定义的槪率分布一起)决定了理想的实驗.我們应用球和盒这种 
形象的語言，但是，同一个样本空間可以允許有很多种不同的实际 
解释.为了說淸这一点幷为了今后的应用，我們在这里抄录一些 
其直覌 背景很不相同的实驗，然而，抽象地看，它們都等价于^•个 
球分布于《个盒中的模型.在这些情形中，其合理的賦槪是不完 
全一样的，后面我們将要重新討論. 

( b , l ) 生日. ，个 人的生日的可能情形相当于 r 个球放人 

♦ « 

365个盒中的不同排列（假定一年有365天）. 

( b , 2 ) 如果把 T 个意外事件按其发生在屋期几 

来分类 的話, 它等¥ r 个球放入« = 7个盒中. 

( b ,3) 子弹相当于球，靶相当于盒. 

( b ，4) 4#._ •把，■个人按其年龄和取业来分类.于是类就 

• • 
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相当于盒而人就相当于球. 

( b ,5) 丰咚学中当光綫射到眼网膜中的細胞时，光 
貭点相当于 i ，'而 的 W 胞就是我們模型中的“盒”.类似地，在 
硏究照射的遺传效果时，染色体相当于盒，而《貭点相当于球. 

( b ,6) 在〒审暫哮哼年寧中，击中盖格 ( Geiger ) 計数器的貢点 
相当于球，而計 k 函 k 相当盒. 

( b ,7) —部专挣，开始有 r 个乘客，它在”层楼中每一层都 
停.乘客走出电梯的各种不同的排列与 f 个球放入"个盒中的各 
神不同排列相同. 

( b ,8) 翠:于.擲 r 个散子的可能結果相当于把，个球放入 
« = 6个盒如果是扔錢币，則对应的盒只有《 = 2个. 

( b ,9) r 个数字所构成的序列的各神可能的次序 

相当于 r 个球 位置) 放入 10 个称为 0 , 1，•••，9的盒中的可 
能分布. 

( b ,10) r 个冬巧单％兮苹.这时我們有《 = 2 个盒以及， 
个球. 

( Ml ) 贈券 （ coupon )* 的收集.不同种类的贈券相当 于盒； 
收集的贈券代表球. 

( b , 12) 四个玩牌者代表四个盒，我們有 

r = 4个球. 

( M 3) 每一个生物(人，植物或动物)的 

后代都从其 s ! 先継'承'一 k 遺传因子.如果一个特殊的遺传因 
子可以有》种不同的方 式决， ，則后代可以按其遺传因子 
的类型来分类.后代相当于球，遺传因子的类型 •” ，尤相 
当于盒. 

( b , 14) ipf . 假定长鏈聚合物与氧反应.每一个鏈都可能 
和0, 1，2,"二/个氧分子起反应.这里参加反应的氧分子相当于 
球，而聚合物的鏈相当于盒. 

* 在資本主义国家里，为了推銷商品迫求利潤，在出售商品中附以贈券，規定在攻 

集了某些花式或号嗎苷可免費获得贈品—— 中譯本 編者. 
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1. {*** I - j — } 

2 ■ { — !***| — } 

3. •( — | — j ***| 

4. {** | * | — } 

5. {** | — | * } 


表2确定了下述理想实驗的样本 空間： 把三个不可辨別的球 
放人三个盒中，而且同样我們可以采用 r 个球放入《个盒中. 

球在实际上是否可辨別与我們的理論不相干.甚至当它們可 
以辨別时，我們也可以作不可辨別的来处理，桥牌中的爱司（例 
( b , 12)) 或者电梯中的人(例 ( b ,7)) 都是可以辨別的，但是經常把 
它們当作不可辨別的来处理反而很方便.例 ( b , 8) 中的殺子可以 
涂上顏色使之可辨別，但是，当我們討論一些特殊的問題时，应用 
可辨別的或不可辨別的球的模型可以根据我們的特定的目的和方 
便来决定.問題的性貢决定了我們如何选择，不过，在任何情形， 
只有当适当的模型选定以后，也就是說，当样本空間选定了以后， 
我們的理論才能开始. 

在上面的模型中，我們考虑不可辨別的球，不过表2仍然是指 
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( b , 15) 在一个照象底板上涂上一层容易感 

光的液体，当这士液 i 的粒手被》•个光子击中时，它就起反应.为 
了区分黑白，我們必須知道多少个粒子（想象为盒) 被* •个光子听 
击中.这里，我們得到一个占位問題，粒子相当于盒，而光子相当 
于球.（当然，实际問題是很复杂的，因为底板上的液体的粒子的 
感光性強弱是不一样的 .） 

( b , 16) 印錯. r 个錯誤在一本具有 n 頁的书中的一切可能 
的分布相当于*'个球放入”个盒中的一切可能分布，不过 r 必須 
小于每一頁的字数. 

( c ) 球为不可辨的情形 . It 我們回到例 ( a ), 幷且假定那三 
个球是不可辨別的.这意 味着： 正如4, 5, 6中的三种不同的排 
列都分不淸了，因此表1变为表 2. 

表2 





第1，第 2, 第 3 个盒，而且它們的次序还是不可觖少的.我們可以 
进一步假定盒也是不可辨別的(例如，盒可以随机地选取而不考虑 
其內容）.当球和盒都是不可辨別的时候，所有可能的排列只有三 
种，卽是 {***1 一 i — }， {** 1 * 丨 _ }， { * I * 卜 }. 

( d ) 柚样. 假定为了估計吸烟的人数,我們任意选収100个 

人作为样本.在这里，我們只对其中吸烟的人数 x 威兴趣，而*可 
以是0到100之間的任意一个数.这样一来，我們可以确定这个 
样本空間是由 r = 0, 1，2,…，100等101个“点”所組成的. 
每个个別的样本或覌察的結果完全可以用对应的点 x 来代表它. 
現在举一个复合事件的例子：“样本中的人多半数吸烟”.这个事 
件意味着，实驗的結果表明， 在； 《： = 51，52,…，100等50个事 
件中有一个发生；究覚发生的是那一个呢？这里幷沒有交待.同 
样，样本的每个性廣，都可以通过列举它所对应的情況或样本点来 
表示.为了术語上的統一，我們宁愿說事件而不說样本的 性貭. 
用数学的术語 来說： 一个事件就是与之对应的所有的样本点的集 
合. . 

( e ) 抽样(級） . 現在我們对这100个人，不但要按吸烟与否 
来分类，而且还要分別他們的男女性別.于是，現在的样本点須要 
由男女吸烟者，男女非吸烟者的人数来表示,也就是由整数的四元 
蛆 ( M ,， M „， 只„)来描述.我們可以把这样的四元組的全体作 
为样本 空間： 其中的每个整数都在0与100之間，而每祖四个数 
的和为 100. 所謂在一个样本中，“男子中吸烟的人相对地多于女 

子中吸烟的人”，意思就 是說： 在这个样本中，比値4•大于 

M „ F „ 

譬如象“点”(73, 2, 8, 17) 就具有这个性貭,而“点’’(0, 1, 50, 49) 
則不然.在原則上，任何事件都可以把具有所須特性的全部四元 
組列举出来作为描述. 

( f ) 扔錢币.如果把一个錢币扔 3 次,这时，样本空間就由 
8个点构成.如果以 H 表示正面，: T 表示背面，那末，这 8 个点就 
可以用 HHH , HHT , HTH , THH , HTT , THT , TTH , rTT 来 
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代表.“其中至少有2次出現正面”的事件可以由这 8 个点中 
前4个所成的集合来表示.“恰巧有1次出現背面”的事件 B •是 
指 HHT 歲 或 THH , 所以我們就說 B 包含着这 3 个点. 

( g ) 配偶的年龄. 保险公司对于配偶年龄的分布有兴趣. 
tt 我們以^代表丈夫的年龄， y 代表妻子的年龄.于是每作一次 
考察就可以得到一个数对0, y). 对应于考察的整个样本空間， 
就可以用 M 平面的第一象限来表示.于是每一个 r >0, y >0 
的点都是这个样本空間中的一个样本点.“丈夫的年龄大于叩岁” 
的事件/，可以用直綫 * =40右边的全部点来 代表； “丈夫的年 
龄比妻子大”的事件 B， 可以用*軸，与第一象限的分角綫 y = x 
之間所夹的角状区域来代表，也就是說可以用^ >y 的点的全体 
来代表；“妻子的年龄大于40岁”的事件 C， 可以用第一象限中位 
于直綫 y = 40以上的部分来代表.至于二对配偶年龄的联合分 
布的几何表示，就需要用到四維空間了. 

( h ) 相空間. 在統計力学里，体系的每个可能“状态”被称为 
相空間中的一个“点”.这仅仅只是术語上的不同，其实，相空間就 
是样本空間，它的点也就是样本点. 

3. 样本空間.事件 

根据前面所述，可以淸楚地看出，我們不討論槪率則已，如果 
要提到槪率，我們总是把它結合着所給定的样本空間（或者用物理 
上的話 来說： 結合着某个理想的实驗)来談.孕 f 申#乎孥嘐吁？ 

irf xWtfEf , ie & “点” A “直綫，，是欧 氏允何 &W 

义的 tfc 念一样.样本点本身的內在性貭与我們 
的理論毫无关系.样本空間在如下意义下提供了一个理想实驗的 

模型，按定义来說就是：李寧宁亨个可筚寧學哼窄孕，等寧孛5尽 
* f T ^ j 帶乎亭•只•有•从^驗•的•争•个•結•果•都 •能 判定 
i 二不发生时，談起 i 个事件/来才有意义. 
代表发生了”这个事件結果的有那些样本点的集合，就完全 
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地描繪着 “^ 发生了”的这个事伴.反过来，包含着一个或多个样 
本点的任意給定的集合 j 都可以当作一个事件来加以討論；这个 
事件是否发生，就由实驗的結果是否由2中的点所表示而定.所 
以亨炒这个詞的定义，等琴孝 f 學宁亨亨了个竽令.我們說 

阜争爭苹“土义.就•是.說•这些点表示 

在理4实驗 i 能的那些結果. 

例. 在例 （2. a ) 的样本空間中，考虑由点1, 7, 13所构成的 
事件 U . 这是一种形式的、直接的定义，但是 ，[/ 可以用很多等价 
的方法来描述.例如， C 7 可以定义为下面三个条件都滿足的事件： 
(1) 第二个盒是 空的； （2) 球 a 在第一个盒中；（ 3 )球6不在。后出 
現.这三个条件的每一个都确定一个事件 . 由条件 （1) 所定义的 
事件 R 由点1, 3, 7 — 9 , 13—15 所构成.由条件 (2) 所定义的事 
件由点1，4, 5, 7, 8, 10, 13, 22, 23所构成，而由条件 (3) 所定义 
的事件由点 1—4, 6, 7, 9— 11，13, 14, 16, 18— 20, 22, 24, 25 
所构成.事件[/也可以考虑作三个事件 C 4, %， C / 3 同时发生. 

术語“事件”和“样本点”有着直覌上的輔助作用，而这些槪念 
等价于在各数学分支中常見的点集和点的槪念. 

在前面的例子和例子 （2. a ) 中，我們看到了，由两个或者两个 
以上的事件可以定义一个新的事件.由于这些例子的启发，我們 
引进事件的形式代数的槪念 （ 卽是点集的代数的槪念). 

4. 事件之間的关系 

現在，我們假定一个任意然而又是固定的样本空間 S 已經給 

定. 

定义 1. 我們用符号^ = 0来表示事件 /不 包含任何样本 
点（卽是不可能事件). 0' 必須了解为一个符号而不是数. ' 

相对于任何一个事件都有以“ J 不发生”为条件来定义的 
另一事件,它包含着所有不属于2的点. 

定义 2. 样本空間中一切不属于事件 j 的点所构成的事件称 
为 J 的外（或称3的非）事件，幷以/記之.特別地，$ = 0 . 
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图 1 m 2 . 

图1和图2說明事件之間的关系.在图1中以粗綫包围的区域是拌 
集 1 > ZUBUC . 中間黑色的三角形区域是交集 ABC , 有浅色阴影 
' 具有月亮形的区域是£与 AUC 的补集之交. 

.对于任意两个事件 J 及总可以伴随着两个新的事件，它們 

是以条件和 S 同时发生”和 氨 B 发生，或两者同时发生”来 

• • • • • • • ••••••• 

定义的，这两个事件分別以 as 和 a U 5記之.事件 / s 包含 d 
和 b . 中所有的公共的样本点.如果 z 和 s 互相排斥，則就沒有公 
共点，因而事件成为不可能事件.这时,我們就用方程 

AB = 0 (4.1) 

表示，幷讀作和 SEf # 寧’，• 事件表示 Z 和同时发 
生，換句話說，就是发'生^0^不发生”.同样， if 表示和 B 
都不发生.事件 ZUB 表示4和 B 中至少有一企发生，它包含旣 
不属于 j 又不属 B 的点以外的全部样本点. 

在槪率論里，事件是 用/和 B 同时发生的話来描述的. 
如果要用标准的数学术語来說，那末就称为/和 S 的（邏輯上 
的)交集.同样， 2 US 就称为 Z 与 B 之幷.这些槪念可以推广到 
好几个事件/， B ， C ， D , …的情见 

定义 3. 对每一組事件 A , B , C , 可以把二个新事件定 
义 如下： 第一个事件是由属于全部給定的集合中的样本点的全体 
所組成的，我們用 ZSC …来表示卞，幷且叫它为 Z ， S ， C , …之 


1) _幷集，也可以称为和集——譯者:注. 
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交 1 > (同时实現).第二个事件是由至少属于給定的各集合中之一 
的样本点的全体所組成,我們用••来表示，幷称之为 
給定的各集合之幷（至少有一个实現).在事件組 B ，（：•• •中， 
如果任何二个都沒有公共点，卽 AB = 0 , AC = 0 , = 

則称这粗事件是两两互斥的. 

我們还需要用一个記号来表达这样的命題：“当5不发生时， 
/不可能发 生”； 或者說的发生蘊含着 5 的发生”.这意思是 
說：/的每 个点都包含在5之中.不妨作一个直观的想象，譬如 
所有的母亲所成的集合是全体妇女的一 部分： 所有的母亲都是妇 
女，但幷不是所有的妇女都是母亲. - 

定义 4. 記号 3 CI 5 及 5 ID〆 是等价的，这表示 Z 的每 一个 
点，都包含在 5 之中,我們分別讀为蘊含 BH 被3蘊含”. 
如果上述蘊含关系成立，我們就用 B - A 来代替 BA ', 它表示事 
件 “ S 发生而 Z 不发生”. 

事件 B - A 包含着所有在 S 中而不在 d 中的那些点.根搪 
这个記号，我們可以写出/ = e - /和 j — / = 0 . 

例. （ a ) 若 X 和 S 互不相容，則 d 的发生蘊含着 S 不发生， 
反之亦然.因此 ， AB = 0 也就是或 BCA '. 

( b ) 事件 A - AB 表示3发生而幷不是 j 和 S 同时发生，因 
此 J — AB = AB ', 

( c ) 在例 （2. g ) 中，事件意味着丈夫的年龄大于40岁而 
且还比他的妻子年 龄大； 意味着丈夫的年龄大于40岁而不比 
他妻子大 . 可以用由 * 軸 ， ： c = 40和 y = x 所构成的无穷 
的梯形区域来表示，事件 AB ' 可以用 f =40和 y = ^所构成 
的三角形区域来表示，后者 y 包舍在区域內.事件表示 
丈夫和妻子的年龄都大于 4 0岁，事件 A [ jC 表示夫妻之中至少有 
一个大于 4 0岁，2 U B 表示或則丈夫大于40岁，如果不然，至少 


1) 两个或两个以±的事件的交的标准符号是或者 AC \ BV \ C 等等.为了 
某些特姝的目的，这种符号更一些，因此，在第二卷里我們就采用这种符号. 
不过，为了排印的簡便起見,現在我們仍用 W 或 ABC 等符号. 
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比妻子大（用一般的語言来說，丈夫的年龄超过 min (40,妻子的年 
龄 ))• 

( d ) 在例 (2. a ) 中，令•表示第/个盒是空的事件 （*_ = L , 2, 
3). 类似地，令 D ,.， T ,. 分別表示第〗个盒放一个，两个，三个 
球.于是 EiE 2 = T 3 , S x S 2 CS } , == 0. 注意 T ^ E 2 , 等等. 
事件是由条件“至少有一个盒放两个球”所确定的. 

( e ) 桥牌（参看第一节脚注）.令岑 < B , C , D 分別表示北家 
至少有一张爱司，南家至少有一张爱司，东家至少有一张爱司，西 
家至少有一张爱司的事件.显然，至少有一个玩牌者拿到一个爱 
司，所以这四个事件至少有一个事件一定发生，因此 j U S U C U Z? 
= 6是全样本空間.事件 A BCD 当且仅当每一个玩牌者都拿到 
—个爱司时才发生.事件“西家有四个爱司”的发生意昧着事件 
A , B , C 都不 发生； 卽是/， _ B '， C ' 都发生，或者 A ' B ' C ' 发生. 

( f ) 在例子 (2.g) 中,我們有 SCCU; 卽是說，“如果丈夫的年 
龄大于妻子 （ S ) 而且妻子的年龄大于40岁，則丈夫的年龄大于仞 
岁 （ J )”. 事件 A - BC 如何用語言来描述？ 

5. 离散样本空間 

最簡单的样本空間，莫过于那些只含有限多个(譬如說"个） 
点的空間. 如果” 很小(例如在扔几个錢币的場合），則(样本)空間 
就很容易具体化.但在玩桥牌的游戏中，要具体化牌的分配情況 
听构成的（样本)空間就比較复杂些.然而无論如何，我們还是可 
以这样来 設想； 把每个样本点描写在一个筹碼上，于是这些筹碼的 
全体，就代表了这个样本空間. 事件/ (例如“北家有2个爱司”） 
就可以用筹碼中某一部分来代表；而万可以用剩下来的那些筹碼 
来代表.只有从这儿再前进一步，我們才能設想到具有无穷多个 
筹碼的情況，或者具有无穷点馬，£ 2 , ••-的一个样本空間. 

例. U ) th 我們来扔一个錢币，一直扔到它出現正面为止. 
于是，这个样本空間的点就是（以 H 表正面， r 表背面，以下常用这 
二个記号，不再注 出）： £ i = H , Ef = TH , E % = TTH , E ^ TTTH , 
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等等.至于 H 永不发生的可能性可以有两种不同的考虑方式，或 
者孰为它是可以設想的，或者孰为那是 不可設 想的.如果我們孰 
为那是可以設想的，那末，这个可能性就用点 A 来代表. 

( b ) 假定有三个人 a , b , c 在作游戏，比如說下棋，其規則如 
下： 幵始时**和&对下，而 e 在局外.誰輸了誰就被 c 来代替，因 
而在第二次游戏中赢家和 < 对下 ，而 輸家在局外.这个游戏用这 
种方式一直作到有一个人接連贏两次时为止，为了簡单起見，每 
一次游戏中不分胜負的可能性不加考虑.我們的游戏的可能結果 
可以由下面的方案来 表示： 

aa 3 acCy acbb , acbaa , acbacc , acbacbb , acbacbaa , ••• 

(*) 

bb , bcc , bcaa , be abb , bcabcc , bcabcaa , bcabcabb ， •••• 
此外，可以 假想沒 有一个人接連赢两次，这意味着游戏按下述方式 
之一无穷地进行 下去： 

(木木） acbacbacbacb ' • • , bcabcabcabca ，• •. 

我們这个理想的“試驗”的样本空間由 （* )和（ * * )所确定，而且 
是无穷的.显然,其样本点可以排成一个簡单的序列，在 （**) 中 
的两个点排在最前面，接着把 （* ) 中的点子按 aa ， 的，沉<?,以 c ，••• 
的次序継續排列下去.（这个例子将要在問題5和6,第五章例子 
(2. a ); 第+五章問題5中継續討論 .） 

定义. 如果一个样本空間只包含有限多个点，或者虽有无穷 
多个点，而这些点可以排成一个簡单的序列五 2 , • • •的話，我們 
就說这个样本空間是离散的. 

幷不是每一个样本空間都是离散的.根据熟知的定理(康托 
( G . Cantor ) 定理），由一切正数所組成的样本空間就不是离散的. 
这里，赴我們把力学上大家所熟悉的特性对比着来 叙述： 在力学 
上，首先考虑的往往是离散的貭点，而每个个別的点都带着有限的 
眞量.这个槪念与眞量連續分布的槪念有着显著的区別，因为后 
者 是說： 每个个別的点都是沒有貭量的.在第一种情況下，要求 
体系的总貭量，只要把个別点的貭量加起来，很容易的就可以得 
到; 而在第二种情況下，总貭量需要按眞量的分布密度进行积分来 
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計算.情形+分相似，在离散的样本空間中，也只要用加法就可以 
算出事件的槪率，而在其他样本空間中，也要用到积分.对于这二 
种情況，除了需要不同工具而外，本貭上幷沒有什么区別.为了从 
反映現实的漑率来考虑，而不为技巧上的困难所限制，我們只討論 
离散的样本空間.以后会看到，卽使只討論这种特殊的情现，也会 
得出很多有趣味而又重要的結果. 

6. 离散样本空間中的槪率 :預备 

各种事件的槪率都是一些数，这些数的性貭犹如几阿学中的 
距离与力学中的貭量.槪率論假定槪率的数値是給定的，但是关 
于它們的实在数値等于什么，怎样測量出来的，却用不着作任何的 
假定.一些重要的应用具有定性的性貭，幷沒有用到数値.槪率 
論的一般結論应用到各个方面，犹如几何定理作为物理理論及工 
程应用的基础一样.当眞正需要知道槪率的数値时（这种情洗幷 
不常見），那末所用的方法和測量距离一样是变化多端的（在測量 
距离时，木匠师傅，測量員，飞行員和天文工作者所用的方法很少 
有相似之处).例如，在我們的书文里，我們要考虑扩散常数，它是 
槪率論中的一个槪念.要想得到扩散常数的数値，那就需要它和 
其它 理論联系起来的物理 思考； 而直接的測定是不可能的.相反， 
为制作死亡率表而需要的槪率数値，却是得自比較原始的覌測資 
料的.在很多应用方面，为了确定槪率，或者把理論与覌測作比 
較，往往要用到一些巧妙的統計方法，而这些方法却又建筑在槪率 
論的精深理論上.換句話說，槪率的直覌意义是淸楚了，但是只当 
理論向前进展了，才能够看到它是怎样被应用.光靠着給槪率下 
这个或那个“定义”，对于实践来說是远远不够的. 

扔一个“均勻的”錢币时，我們毫不犹疑地孰为正面和背面的 
槪率都是 1/2. 这也就是說，如果扔錢《次，那末 2" 个可能結果都 
有相同的槪率.从理論的观点来看，这无非是一个約定.許多人孰 
为这个約定是不可避免的，而且是唯一可能的一个，另一方面，曾 
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經有一批哲学家和就計学家不满足于这个約定，主张从相矛盾的 
假設出发（自然界的齐一性或不齐一性）.也有人主张，1/2这个 
槪率是从經驗得来的.然而，每当使用精深的統計方法来检驗实 
际扔錢的結果的时候，結論总■归 是： 正面和背面的出現不是等同 
槪然的.尽管“絕对均勻的”錢币幷不存在，我們还是坚持有一个 
“理想”的錢币.这不单单是为了它的邏輯簡单性，主要是因为它 
是有用的而且是能用的.一則，在許多应用方面，这个模型已經把 
現实描写得够准确的了.更重要的却是这样一个經驗事实，卽 是： 
每当与我們的模型偏离时，总是伴随着，例如，重心的位置不正的 
現象.这样一来，就算理想模型永远不会絕对准确地实現，它倒反 
而是非常有用的了，因为对它的偏离可以提醒我們去发掘潛伏着 
的不正常現象.举例来說，在現代統計的貭量控制法 [ 創始人是休 
哈特 ( Shewhart )] 里面，我們就使用理想化的槪率模型，以便在对于 
模型有显著偏离的时候,就去查究“可推源的原因”,从而及早地淸 
除掉卽将来临的机器故障和生产过程中的不正常現象. 

类似的討論可以应用到其它的場合.例如，分配桥牌方式的 
可能的数目大約在 10 30 左右.通常，我們約定把它們作为等同槪 
然的.要想对这个約定作一次核对，那么必須进行 10 30 次以上的 
試驗——相当于一个人，日夜不停地每秒鉀玩一局，大約要玩一百 
亿亿年（10 14 )的局数.虽然如此，这个假定的后果还是可以用实驗 
来驗証的,譬如說，用覌察手里拿到2个“爱司”的頻率作实驗，就 
可以来驗証它.覌察的結 果是： 只需把牌洗得特別勻，理想化的 
模型确是将經驗描写得大致不差.更重要 的是： 当理想化的模型 
发生問題时，那就有可能使我們进而去发現矛盾存在的 1 ‘可以推源 
的原因”，例如，需要改善洗牌的方式.这些都是不怎么重要的例 
子，但它們还是显示了假設模型的用途.更有趣味的情形，在以后 
还会談到. 

例. 0) 可攀 呼. 在例 (2. a ) 中，自然地假定所有的样 
本点郡是等可能*的\ —个样本点都具有槪率 1/27. 我們可 

以从这个定义出发来硏究其結果.我們的模型是否和实际实驗很 



相合将要依賴所考虑的現象的类型.在某些应用中，从物理意又出 
发，可以作“等槪性”的 假設; 但是，在另外一些应用中，它之被引进 
只是作为一般情形的一个最簡单的模型，甚至有时很明显地看出 
它只是一个粗糖的第一步的近似，我們仍然作这种假設.（例如，考 
虑例子 （2.b，1) 生日； （2.b, 7) 电梯 問題； 或者 （2.b，11) 贈券收集 .） 

(b) 現在，我們回过 

来考虑三个不可士別的球分; ft 于 k 个盒中的例 （2.C ). 球之不能 
辨別是不影响实际的物理試驗的；从物理上看，卞們仍然有 27 种 
不同的可能，虽然其中只有10种可以辨別.这种考虑使我們对表 
2中的样本点可以按照下述办法 賦槪： 

点数： 1 23456789 10 

槪率： j _ 

27 27 27 9999999 

只有当这个結論在例 （2. b) 中所抄录的許多应用中是正确的 
时候，这种賦槪法才是合理的.在一个长时期內，我們的結論都被 
接受下来，沒有产生什么問題，而且沱是作为統計力学中的 r 个球 
分布于"个盒中的馬克司威尔-波茨曼統計的推导的基础.但是， 
当波司和爱因斯坦証明某些貭点遵从波司-爱因斯坦統計时（詳細 
倩形，参看第二章第5节），才引起人們的在我們的情形 
下， « = r = 3,波司-爱因斯坦給这+个样本点中的每一个都賦 
以槪率 1/10. 

这个例子将要說明，在相同的样本空間中可以有不同的 
法，幷且还将說明理論和实驗之間的特別，它吿訴我- 
f 不要过分地信賴前面的結論，而要准备接受新的非先驗的方案. 

(c> 等槪性的假設常常需要眞正的实驗的記录来 

說明.在实 W 中'，每一个錢币总不能絕对均勻，但是，可以設計一个 
物理实驗，使其与理想的扔錢币的模型非常近似.为了給出一个 
期望的波动槪念，我們給出一个对应于10000次扔錢币的假想的 
試驗 1} .表3包含了每100次試驗出現正面的次数，而每100次:試 

1) 这个表眞实±也記录了具有100,000正态离差的1,000,000.个随机数中偶数的頻数. 
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表 3 


纖次数 丨 



正 


面 

次 


数 


总数 

0—1000 

54 

46 

53 

55 

46 

54 

41 

48 

51 

53 

501 

—2000 

48 

46 

40 

53 

49 

49 

48 

54 

53 

45 

485 

—3000 

43 

52 

58 

51 

51 

50 

52 

50 

53 

49 

509 

—4000 

58 

60 

54 

55 

50 

48 

47 

57 

52 

55 

536 

—5000 

48 

51 

51 

49 

44 

52 

50 

46 

53 

41 

485 

—6000 

49 

50 

45 

52 

52 

48 

^7 

47 

47 

51 

488 

—7000 

45 

47 

41 

51 

49 

59 

50 

55 

53 

50 

500 

一8000 

53 

52 

46 

52 

44 

51 

48 

51 

46 

54 

497 

—9000 

45 

47 

46 

52 

47 

48 

59 

57 

45 

48 

例 

—10000 

47 

41 

51 

48 

59 

51 

52 

55 

39 

41 

484 


驗对应于把一个錢币扔100次.其总数为 4979. 看了这些数字 
以后，讀者很可能产生一些含糊的咸覚：这說明什么呢？为了判 
断对什么范围来說能使經驗事实与抽象模型一致，需要一些更高 
深的理論.（在第三章第7节我們将要回过来考虑这件事情 .） 

7. 基本定义和規則 

碁本的約定. 給定一个含有样本点 A ， e 2 ，…的离散样本 
空間6,我們假定对每一个点&都賦以一个数，这个数称为•的 
槪率，記以 P {£;}. 这些数都是非負的而且滿足 

P{£J + P{£ 2 } + ••- = 1. (7.1) 

注意，我們幷不排除一个点的槪率为0的可能性，这种約定可 
能产生一些人为的但却是必需的复杂性.在离散的样本空間中， 
零槪率在实际中解释为不可能，因此，把 B 知其槪率为0的样本点 
从样本空間中除去是无妨的.然而，事前往往不知道其槪率的数 
値，因此，判断一个样点的槪率是否是正的需要深刻地推理. 

定义. 任何一个事件 a 的槪率 P 04) 是 j 中所包含的样本点 
的槪率的总和. 

基本方程 (7.1) 說明： 全样本空間的槪率为1，卽是 P {6}=1. 
由此推出，对任何一个事件 Z ,都_ 
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0 < P {^} < 1. <7.2} 

現在我們考虑两个任意的事件 4 和木.为了計算或則 A 发 
生，或則决发生，或則两个都发生的槪率 PUiU ^} ，我們把或者 
属于或者属于為的样本点的槪率加起来，不过每一个样本点 
只算一次.因此，我們有 

P {^ iU ^ 2 } + P { A 2 }. (7.3) 

如果五是一个旣属于為又属于决的样本点，則 P {£} 在右 
边出現两次，而在左边只出現一次.因此，右边比左边大 P {4 烏 L 
从而我們有下述簡单的但却是重要的 

定理. 对于任何两个事件4和或4发生，或冯发生， 
或為， 木都发生的槪率由 

1*{為11為} = P {^ i } + P { A 2 } - PiA ^} (7.4) 
所給出.如果為為 = 0,也就是說4和决是互斥的，則 (7.4) 化 
为 


P {^ iU ^ 2 } = P {^} + P { A 2 }. (7.5) 

例.把一个錢币扔两次.我們把四个点 / fH ， Hr ， r //， r:r 
作为样本空間，每一点賦以槪率 1/4. 令 决和禹 分別表示事件 
“第一 次出現正面”和“第二次出現正面于是4包含了 hh 和 
HT , A 2 包含了 TH 和 HH , 因此為 U 為包含了三个点 HH , HT 
和: TH ， 而応决 只包含一个点 HH . 因此 



”个事 件中至少有一个发生的槪率 P {^ U ^ U ‘ hU /,} 可 
以用类似 (7.4) 的公式 算出； 这个計算将在第四章第1节进行.这 
里我們只注意 一点： 不等式 (7.3) 显然对一般情形都成立.因此， 
对任意多个事件木， • •. 不等式 

P{^iU^U---}<P{^i} + P{A 2 } + … (7.6) 

成立.特別，当為， • • •互斥时，我們有 

P{^iU^ 2 U •••} = P{A X ) + P{A 2 } + …. (7.7) 
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有时称 (7.6) 为布尔 ( Boole ) 不等式. 

我們首先考虑一个簡单特殊 情形： 样本空間只有有限个样本 
点，比如說有 AT 个，而且每一个样本点的槪率都是 1/ AT . 在这种 
情形下，任何一个事件2的槪率等于其中的样本点的个数除以 iV . 
在古典文献中，样本空間中的点子叫作“情形”，4中的点子叫作 
“有利情形”（有利于 /). 如果全部的样本点的槪率都是一样，則 
事件 J 的槪率等于有利情況除以一切可能情形.不幸的是，这种 
叙述被濫用来作为槪率的“定又”.常常以为每一个有限的样本空 
間中的全部样本点的槪率都是一样的.其实，幷不如此.例如扔 
一个不均勻的錢币，样本空間只包含两个点，正面和反面，但是它 
們可以具有任意的槪率 P 和？ ，其中 P + q - l . 一个新生的嬰 
儿可能是男孩也可能是女孩，但是实际上它們的槪率可以不一样. 
(6. b ) 給出了一个进一步的反例.全部样本点的槪率都一样的样 
本空間的用处几乎全部局限于硏究机会游戏和組合分析. 

8.問 題 

1 •在1，2, 3, 4, 5五个数字中先任意抽取一个，然后在剩下的四个中苒 
抽取一个.假定这全部20个可能的結果都具有相同的槪率,試求有一个奇 
数在 ( a ) 第一次被抽出；（1»〉在_二次被 抽出； （ C ) 二次都被抽到的槪率. 

2.在例 (2. a ) 的样本空間中，給全部27个点以相同的槪率.利用例 (4. d ) 
的符号，对事件冷= Si , 办=&来驗証公式 (7.4), 〜心包含多少样本点？ 

3 •考虑符号1234的24种可能的排列，幷且对每一个排列都賦以槪率 

令々为数字 i 出現在其自然位置(其中 《'= I , 2 , 3 , 4 )的事件.驗証公 
式 (7.4). 

4 •扔一个錢币，直到它連纜地出現两次相同的結果为止.設扔《次的每 
一个可能結果都具有相同的槪率試描述这个样本空間，幷求出下列事件 

的 槪率： 0) 实驗在扔第6次之前結束； （ b ) 須要扔偶数次才結束. 

5 .在例 (5. b ) 的样本苕間中，我們对 （* ) 中恰巧包含《个字母的样本点 

賦以槪率(換句話說，叩和 W ■具有槪率具有槪率+，等等 .） 
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証明 （*) 中的样本点的槪率之和为 1,(**) 中之两个样本点的槪率为 

0_( b ) 証明 a 胜的槪率为6胜的槪率 也是士 ，而^胜的槪率为务 •（ c ) 
14 14 7 

在第々局或在第&局前无法判断誰胜誰負的槪率为 

6. 变更例 (5. b ), 計箕每一局中不分胜負的可能性，給出造当的样本空間. 
你将如何定义槪率？ 

7•在問題3中，証明和々々々'匚/;. 

8.利用例 （4_. d ) 的符号証明 （ a ) S ! S2D 3 = 0； ( b )5 iD 2 C £ 3 ； Cc ) E 3 - D 2 S-Zi 
S 2 Di. 

9 .擲两顆骰子.令 A 为点数的和是奇数的事件， S 为至少出現一个么点 
的事件.試描述事件 dS ， A[JB, AB\ 如果假定全部 36 个样本点都具有相 
同的槪率，試求 AB,AUB, AE r 的槪率. 

10, 在例 （2. g ) 中，試叙述下列事件的 意义： （ apBC ; (b)A - AB- 

( c ) 冰 C . 

11 . 在例 （2. S ) 中，試驗証 JC ' CB . 

12 .在桥牌游戏中，令心(々=1，2, 3, 4) 为北家至少有 々个爱 司的事 
件.以分別表示南，东,西各家至少有々个爱司.在事件 

( b ) A ? 2 5 2 ； ( c ) N ；5； E ；; ( d ) W 2 - W 3 ; ( e ) NiSiEiWi ； ( i ) N 3 W r , ( g )( W 2 Ui 2) E 2 
中，試問西家有几个爱司？ 

13 •在上題中，試驗証 ( a ) S s dS 2 ； (b) S 3 W 2 = 0 ； 〔 c ) N^EiWt = 0 ; 

( d ) N 2 5 2 C ^；； ( e )(. V 2 US 2 ) H ^, = 0； ( i ) W ^ = N [ S [ E [, 

14 •試驗証下列关系式 4 

㈠ (A\JBY = A'B'-, 

( b ) (d U S ) — S = j = AB'-, 

( c ) AA = A [j - = A\ 

(d) (A — AB) \JB = A\JB ； 

( c ) {AUB) ^ AB = AB f ]JA f B ； 

(f) A'UB' = (AB)'; ' 

( g ) (A\JB)C = AC[JBC. 

15 .化 簡： （ a ) OUB )( JUB ') ; ( b )(^ UB )(^ ， UB )(^ UB ， )； 


J ) 注意表示 JUB 的补集，与 J ' UB ’ 的意义 不闻， 同样 ，（ dS )' 与 iff 
的意义亦不相同， 
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( c )(^ U 5)( BUC ). 

16 .試述下列关系中哪些是正确的，哪些是錯 誤的： 

( a ) (/ US ) — C = WU (石一 C ); 卞， 

(b) ABC = ^ 

(c) A\JB\JC = A\J(B — ， •/ Bj) u (C — 

(d) A\JB = {A AB) U 

( e ) (^BUBCU C ^)3^ BC ' j 

(f) (^£UBCUC^)cz (PUBLIC )； 

( g ) (^ UB ) — B ; V 〜 

(h) AB'CdA\JB; 

(i) (dUBUC)' = A'B'C'- 
(i) ouByc = A'CUB'C; 

(k) (AUByc = A r B r C- 

(l) (ADByc = C — C(A\JB) p 

I 7 .令 k ， S ， C 为任意三个事件.試用 S , C 来表达下列事件： 

( a ) 只有 W 发生； 

( b ) J 和£都发生而 C 不发生； 

(0 所有这三个事件都发生； 

( d ) 尖 B ， C 中至少有一个事件 发生； 

( e ) 至少有二个事件 发生； 

(0 恰有一个事件发生； 

(*) 恰有二个事件发生； 

< h ) 沒有一个事件发生； 

(0 不多于二个事件发生. 

18.任意二个事件之幷 AUB 可表示成二个互不相容的事件之和，例 
AUB = AU [ B - AB ), 試用类似的方式表达三个事件 J ， E ， C 之幷. 

19 .利用問題18 .的結果証明 

P{^UBUC} = P{^} + P{B} + P{C} — P{AB ) — 

— P{AC} — P{fiCj + P{^SC}. 

[这是第四章 （1.5) 的特殊情形 J 
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第二章組含分析槪要 

这一章的目的在于导出一些基本的公式，丼发展相应的槪率 
背景.有一定程度的讀者可以不讀这章，而直接閱讀第五章，在那 
里重新提到第一章里所引出的主要理論綫索. 

在簡单的机会游戏、抽样手續、占位及序次等等問題里面，我 
們通常遇到的情 況是： 有限样本空間，各个样本点的槪率相等. 
这时，要想計算一个事件 j 的槪率，只要把 Z 中的点（有利情现）的 
个数，除以样本点（可能情況）的总数就成了.如果有系統地使用 
几条法則，就可以使这計算更容易一些，現在我們就来把这些法則 
給以槪括.始終遵循着几个标准的工具，可以导致思維的簡化和 
节省，我們将要遵循的进程就是这样，而不是在一个一个的特例 15 
上考究最簡短的計算方法. 

1.預备知識 

对子. 給定 m 个元素 ai ， a 2 , • • •， 知 及》 个元素 匕，匕，…， 
K . 从以上两組的每組中取出一个元素配成对子 U ， ~)，一共能 
酉己成 7 WJ 个对子. 

証.象乘法表那样，把对 子用历 个橫列和》个級行排成一个 
矩形陣，于是（^， &) 恰巧处在第/列和第々行的交点上.因此， 
每个对子恰好出現一次，从而需証之結論乃属显然. 

例. （ a ) 桥牌(参閱第一章第1节的脚注).把4种花色和 

• • 

13个面値当作二組元素来看.每张牌都由沱的花色和面値决定. 
因此，这样的粗合共有4 • 13 = 52种，所以就有52张牌. 

( b ) “七用灯”.广吿上叫作“七用灯”的，是这样一种 灯：它 

• •鲁 

1) 有兴趣的讀者可以在經典的教科书 [ 4 ] 里，找到很多初等組合分析的資料.还 
可参閱文献 [ 5 ], 其中包含700个附有完全解答的間題. 
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有 3 个普通的灯泡，外加一个操枞发光的装置，能使在三 
个不同程度上发光，但也可以不开动此装置.这四个可能性，每个 
都可以和0个，1个，2个或3个灯泡結合起来.所以一共有16 
个組合，其中之一（卽（0, 0)) 使得灯泡一个也不亮.剩下还有15 
种方式（不是7种）来操枞灯. 

多元組. 給定叫个元素«2， * • • 5 w 2 个元素&， 
bi , • • • , b „ t , 依此类推到》,个元素々，巧， • • • , x „ rr 从以上各組 
的每組中取一个元素来配成多元組(« ；1 , b H , …， x ir ), 一共可以 
配成 〜• • •》, 个多元粗. • 

証.若 》■ = 2，多元組的問題归为对子的問題，因而我們的 
命題成立.若，= 3,可取对子(+，作为一类新的元素，則有 
«1«2个对子和 W 3 个元素 q ， 每个 3 元祖 （3,., 为， q ) 本身可以看作 
由和元素 Q 所組成的一个对子，因此3元組的个数共有 
«!«2«3 用归納法可以証明，这个結論对每个，都成立. 

也許如下所述的是最簡单而且最有用的来描述上面的定理的 
方法.为了构成一个多元組(吒， •••, 化），我們曾經选取一个 
a , — 个等等 . 我們总共选了》■次，而且依次地有 » i , n 2 ,---, n r 
种可能的选法.由此 断言： 这种手法会得到柯 •《；!•••», 种不同 
的結果. 

例. （ c) 假定把人按其姓別，婚否和职业进行 

分組,各种状元素.如果社会上只有17种取业，則总 
共可以分成2 . 2 • 17 = 68組. 

( d ) 在一个农业实驗中，要試驗三种不同的处理（如施肥，噴 
雾剂，温度).如果这些处理分別有 r 2 和种实施的水平或浓 
度，則实施的方案共有种. 

( e ) “準亭零^拿宁”归結为对每一个球选取一个盒.对于 r 
个球，我們就有次独立的选取，因此 r 个球置人《个盒中有7 /种 
不同的方法.回忆第一章例 (2. b ) 使我們 得知： 有很多实驗抽象 
地看来和“球置入盒”是等价的.例如，把殺子的各个面都看作“盒 
子”，則前面的命題 断言； 把一个骰子擲 r 次共有以个可能的結 


• 29 ♦ 




果，其中有 y 个結果滿足“么点从未出現”的条件.假定全部可能 
的結果都是等同可能的，“因而 r 次抛擲中不出現”么点的槪率为 


我們可能会这样天眞的 期望： 擲六次骰子，么点一定出 


現，其实不然，这一事件的槪率仅仅是 1 一 d ) 6 
[参看例 （3_ b )]. 


或者小于2/3 


2.有序样本 

考虑”个元 素別， &，•■•，〜所組成的集合或总体.任何， 

• • 

个元素 a ,+ a , • • • , a ir 的有序排列，就称为从总体中取出的，木 
个与 y 为了形象化起見，我們可以設想，元素是逐个 

i 个地 mkA .* +是就有两种可能的手續.第1种是有每:亭巧準 
f ；在这里，每个元素的抽取都是在整个总体中进行的， iiui # 
&元素可以被抽到一次以上.因此在样本的排列中容許有重复的 
元素. 第 2 种是字率亭坪 f ， 在此，某个元素一旦被抽取，卽被 
从总体中除去，所本^^排'列中，不会有重复.显然，在这种情 
況，样本的大小，不能超过总体的大小„. 

在有放回的抽样里，样本的个元素的每一个都可以有》种 
抽取的方式，所以可能的样本数为 〆 .这一点从刚才的定理可知， 
只要 It 定理中的 «1 = « 2 = ••- = n 卽可.在无放回的油样里， 
样本的第1个元素可以有”种抽取方式，而第2个則只有 (《 — 1) 
神，第3个只有 (《 — 2) 种，依此类推.根据上述定理可知，无放回 
抽样的样本总数是 n(w — 1) ■ • * (w — r + 1). 这个乘积經常出 
現，为了方便起見，引进記号 1 > 

(«) r = n(jt 一 1)- • - (ji — r 4- 1). (2.1) 

显然，当 r n 时， ( n) r = 0. 于是我們有下面的 

定理.从《个元素所成的总体中，取大小为 r 的柚样.如果 
抽样是有放回的，則有'个不同的 样本； 如果抽样是无放回的，則 


1>記号井不是标准的，甚至》不是整数时,本书也一貫地用它, 
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有 ( re ) r 个不同的样本. 

我們注意 r = w 的特別情形，在无放回的抽样中，一个大小 
为 w 的样本包含了其总体的全部元素，它构成了其全部元素的一 
个 排列. 因此，”个元素 a !，■ • • ，有 («)„=« • (ra —1)* • ，2 • 1 
种不同的方式排成次序.我們用符号《!来代替(《)„，《!是一个常 
用的符号.因此，我們有 

呆.》个元素能排成的不同次序的数目为 

71! = « • (» 一 1) - • • • 2 ■ 1. 

史密斯夫妇是从人类的总体里所抽出的大小为2的一个样 
本，他們也是一切配偶所成的总体里所抽出的大小为1的一个样 
本.迖个例子說明，样本的大小，只有相对于所給定的总体来說才 
是确定的.又如把一个錢币扔，次，就是从 H 和: T 两个字所成的 
总体中抽取大小为的一个样本 . 这个由 H 和 r (—共 r 个)組成 
的排刻，也就是样本空間（卽是对应于扔錢币 r 次的实驗的那个空 
間）中的一个样本点. 

从大 小为” 的总体中抽取 r 个元素是一个实驗，实驗的可能 
結果就是这些大小为，的样本.屯們的总数是 〆 或 （》)„ 随着抽 
取的方式是否有放回而定.无論哪一种情況，我們的理想实驗是 
用样本空間来描述的，其中每一个个別的点都代表大小为的一 
个样本. 

到此为止，我們还沒有談到过联系着这些样本的槪率.我們 
通常賦予各个样本以相等的槪率，这样的样本就叫作随机样本. 
“随机”这个詞在其一般的意义上还沒有定义，但是用在抽样或选 
择的場合时，它倒是有着特定的意义的.无論何时，只要我們談到 
固定大小，的随机样本时，形容詞“唔切意味着吁寧 — ㊉ 疗 

本都具有相同的槪率.在有放回抽样 i ， 这个相同的 

• •••••••* 

n ' 而在无放回抽样中，則为"^，而》表示取样本的那个总体的 

\n)r 

大小. 如果”大而， 相对地小，則比値 g 接近于 1. 这就說明 

n r 
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了这样的一个 事实： 如果总体大而样本相对地小，有无放回的二 
种抽样方式的区別是可以忽略的[参看 11.1, 11.2 和第六章 35]. 

上面 B 經引进了应用的术語“随机的”，但是尙未說明我們的 
随机抽样的模型对于現实世界的适用性.扔錢币、擲殺子和类似 
的一些游戏，都可以解释为有放回的随机抽样的实驗，幷且我們所 
賦給的槪率很接近于在长期持續实驗下所現察到的頻率，卽使完 
全均勻的錢币和骰子幷不存在.从一付冼得很好(比平常洗得还 
要好）的紙牌中，不断地进行抽取，就是无放回抽样的一个典型例 
子.在人口的抽样中，統計学家往往遇到巨大的和无法預料的困 
难； 經驗表明，在这种場合，甚至連随机性的粗略的形象都是不容 
易获得的. 

练习.在无放回抽样中，总体中任何一个固定的元素包含在大小为， 
的随机样本中的槪率为 

1 — — 1 ) f -r (»)r = 1 —-- -- - . 

» n 

在有放回的抽样中，其对应的槪率为 

1 — {(» — 1 )/«}<•, 

3•例 

我們考虑从一个 包含” 个元素的总体中柚出一个 
大小为 r 的有放回的随机样本.我們威兴趣的是“样本 
%)中沒有重复元素”的事件名也就是，迖种样本可以从无放回的 
柚样所得到.前面的定理証 明了： 不同的样本的总数是/个，其 
中有 in ), 个滿足上述条件.假定各种排列都是等可能的，則我們 
断言： 在我們的样本中沒有重复的槪率为 

? = («)r = n{n —!)■••(»— r + 1) (3.1) 

n r n r * 

下面关于这个公式的具体解释将显示出这个公式的广泛应用. 

( a ) 令总体由数字0, 1， . • ■ ，9所构成.每 

次抽5个的排列是一个大小为，= 5的样本，我們假定 
每一种排列的槪率都是10_ 5 .由 (3.1) 5个連續随机数宇郡不相 

• n • 



间的槪率为 p = (10) 5 ltr 5 = 0.3024. 

根据我們直覌的想法，在具有小数位很多的大多数数学表格 
里，最末5位数字具有很大的随机性(在普通的对数表和其它一些 
小表里，表差近似地为常数，因此最末一位小数是有規則地变动 
的）.作为一个实驗，选取有16个位数的表[ 6] ，幷把表中所列的那 
些数 ■■ —其最末的5位数字都不相同的——枚举出来.在每組有 
100个数碼的最初12个粗中，具有5位不同的数字的数碼的个数 
变动如下： 30: 27, 30, 34, 26, 32, 37, 36, 26, 31, 36, 32. 小子 
样理論証明，这样起伏的量会很好地落在期望限度以內.这里的 
平均頻率为 0.3142, 与理論上的槪率 0.3024 是+分近似的[参閱 
第七章例 (3. f )]. 

下面，我們来考虑数 e = 2.71828---. 把最初的800位小数 m 

分成160段，每段有5个 数字; 幷以每組10段排成 I 6 蛆.在这 I 6 

蛆中，所有5个数字都不相同的列举如下； 

3, 1，3, 4, 4, 1，4, 4, 4, 2, 3, 1，5, 4, 6, 3. 

頻率的波动应該在 0.3024 周围.捃小 子样拟 合理論，上下波动的 

振幅幷不比所期望的大.在这160段里，我們所考虑的事件的整 

个頻率为= 0.325. 它很合理地近似于 p = 0.3024. 

160 

(b) wa « 

宇岁 》!/»"• 这个非常 小：对 》= 7 来說，它为 0.00612 …. 

意味着如果在一个城市中每一周发生7次意外的事件，則(假 
定各种分布都是等可能的)实际上每一周都包含有这样一些天，它 
发生两件或两件以上的意外事件.平均来說，大約165周才有一 
周每一天都发生一件意外的事件.这个例子說明了随机性的一个 
意料不到的性貭 .（7 个球置入7个盒中的全部可能情形在第5节 
表1中都列出了，两个或两个以上的盒空着的漑率大約为 0.87.) 
当 n = 6时，槪率 f 等于 0.01543 •--.这說明把一个均勻锻子 
擲六次，要得到每一次出現的点数都不相同是如何的不容易，[— 
个給定的点不出現的槪率大約为参看例 （ l . e ).] 
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( c ) 在开始时載有 7 位乘客的一架电梯，在 /* = 1.0 

黾的楼房的每一层上都停留，試問不发生2位乘客在同一层楼上 
离开电梯的槪率 P 为 f 可？为了使問題确定起見，假定乘客离开电 
梯的各种安排有同等的槪率（这只是大槪的，粗略的近似).于是 
p = 10 _7 (10) 7 = (10 • 9 • 8 • 7 • 6 • 5 - 4)10 -7 = 0.06048 ‘ 
假使这事件一旦发生，我們就孰为发生这件事是奇特的，而对 
重复来說发生的可能性在1000次中只一次（参閱問題 10-43 的答 


案）. 


( d ) 丰甲. 任意 r 个人的生曰可以看成为从一年的全部曰 
子所构成的总体中柚取的大小为 r 的一个样本.虽然每年的时間 
不是等长的，而在整个一年中，人的出生率也不是固定不变的，但 
是，作为第一步近似，我們还孰为，随机地抽取人，和随机地柚取生 
日是一样的，其次，为了簡单起見，每年就以3仍日来考虑. 


有了这种約定利用（3.1)，我們算出所有 r 个生日都不相同的 
槪率 P 为 [8] 


(365)” 

365 r 


1 


— 誠 1 


1 — 


365V 


1 


r-1 ) 
365 ) 


(3.2) 

其数値結果是令人吃惊的.对，= 23个人来說，也就 

是說，对23个人来說，至少有两人同一天生日的槪率超过 

公式 （3.2) 看来+分繁笨，但是可以容易地推出近似表达式. 
如果『小，各因子的第二項之間的乘积都可以忽略，于是有一个粗 
略的近似 公式： 

p ^i - 1 + 2 + … 卜 （ ― r . D = 1 — 士―二 O ' ( 3 . 3 ) 


例如当/ • = 10时，正确的数値为/> = 0.883- • 而（ 3 . 3 )給 

出的近似値为 0.877. 

对于較大的 r 可以用对数法氽得很好的近似値.只要 X 为正 
&很小，有 log(l — AT ) 〜 ~ x m 于是由 （3.2) 可得 


• 34 • 



-K 


log? 


1 + 2 + 


• ( r 一 i) 

365 


r(r 一 1) 
730 


(3.4) 


对于 r = 30,这个公式給出的近似値为 0.3037, 而正确値为 p = 
0.294. 对于 r <40，（3.4)的誤差小于0.0 8 .(在第 7 节中継續討 
論此問題,也可参看問題 10.44 的答案 .） 


4. 子体和分划 


和以前一样，我們用大小为》的总体来表示一 个由” 个元素 
构成的不分次序的集合.所謂两个总体不一样，意思就是說有一 
个总体有一个元素不属于另一个总体.从一个大小为《的总体里 
选取》•个元素就构成了一个大小为『的子体.这种选法有多少种 
呢？每一个大小为^的子体可以排列成 r ! 种不同的次序，因此用 
这种办法可以产生 r ! 个不同的沒有重复的 样本. 反之，每一个这 
样的大小为的样本包含》•个不同的元素，因此它确定了一个大 
小为， 的子体.我們知道上述的样本一共有 （》), 个.如果*是 
大小为 r 的子体的个数，則有序样本的个数为 * - r \, 因此我們断 
言； c = { n ) r / rl . 这种形式的数目称为二項系数，它們的标准符 


号是 

__ (») f _ n、n — l)...(n — r + 1) 
\r) r ! 1 • 2 • • • — 1) • r 


(4.1) 


因此，我們証明了 

定理 1 . —个包含》个元素的总体可以产生个不同的子 
体 (r < 

換句話說，从》个元素中可以用种不同的方法选出包含 》■ 

个元素的子羣.因为从”个元素的总体中选取》■个元素和留下 
» - r 个是等价的，因此，对 r < »显然有 



为了直接証明方程(4. 2 ),我們只須 注意： 把二項系数( 4 .1)換成下 
面的写法 
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[只需把 (4.1) 的分子分母同时乘以 — r )! 卽得 (4.3).] 注 意：方 
程 (4.2) 的左边当 r = 0 时是无定义的，但右边却是有定义的.为 
了使 （4.2) 对一切滿足0 < r < »的整数 r 都成立，我們定义 

( o ) =1，0! = 1， (4.4) 

和 O) 0 = i . 

例. （ a ) f 哼 f . 时. 1 、亨〔参看第一章脚注 ( 1 )). 因为在一个 
人的手中的牌 序 a 不 相干的，前面的定理証明了一付紙牌 

有 d ) = 635 - 013 , 559 , 600 种不同的桥牌和( 5 5 2 ) =■= 2,598,963种 
扑克. tt 我們来計算一个人的手里的扑克包含5张不同面値的槪 

率*.这些面値可以用种方法选取，而且对应于每一张牌我們 

可以自由地由四种花色中的一种选取.由此推出 ， x = 4 5 . 

( 5 5 2 )，它近似地为 0.5071. 在一个人的手里的桥牌中，13张面値 

都不同的槪率为4 13 + 或者近似地为 0.0001057. 

( b ) 48个州中每州有2个参議員.考虑由其中任意选取48 
个参議員組成委員会这样的事件.假設 （ 1 ) 指定某州要有代表； 
( 2 ) 所有的州都要有代表. 

在第一种情形，其逆事件的槪率穿要好算些.所謂逆事件，就 
是指定的那个州沒有一个代表作为委員.总共96个代表中，有94 


个不是那个州的代表.因此 




48 • 47 

—~— = 0.24737 •-- 
96 - 95 


其次，第 2 节的定理 証明： 委員会要使每一州都有一个代表 • 

的选取方式共有 2 48 种.因此，所有的州都有委員的槪率为 

( 43 ). 利用史特令公式（参看第9节），可証 p 〜 (3 ? t ) i 2 - 46 « S 
4 . 10 _M . 
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( c ) 点培 If 寧.我們再一次考虑 r 个球随机地分布于》个 
盒中（卽是能的排列都具有槪率《 1 ).为了找出一个給定 
的盒中恰巧包含々个球(々-= 0 , 1 , 2 ，...）的槪率内，我們首先注 

意： 々个球可以有种方式选取，而剩下的 》• 个球放入剩下 

的》— 1 个盒的方式有 （《 — l ) r - 4 种.由此推出 

pk == ( 0 ^' (n ~ iy ~ k = © • *. g — ( 4 - 5) 

这就是所謂二項分布的一种特殊情形，二項分布在第六章中将要 
討論.数値可以从第六章表3中查出. 

( d ) 皁争 - 寧芩窄 ㊉ 冬 ff . 考虑一个由 n^a + b 个元素 
构成的总其个¥属»司一类的,而其余 6 个是属于另一类 
的，为了方便起見，我們用而， • _ • ，和 ft , • • •，扎 代表其元 
素.这些元素可以排成》!种不同的次序.然而，如果我們豹定所 
有的 a 和所有的 j8 內部是不可分辨的（卽是不考虑其指标），那末， 
某些次序就变为不可分辨的了. 事实上，每一个次序由其《个《 

$位置所唯一确定，而这些《可以由 t = t 1种不同的 
方式选取.因此，一个由 a 个不可辨別的《和6个不可辨別的 JB 
所构成的总体可以排列成^ = j 种可以辨別的次序. 

(例如，序 «« a ^ 可以排列成 10 个可以辨別的次序 .）《 中的任何 
一种排列或者| 8 中的任何一种排列都不改变其外貌，所以有 a \ b \ 
种排列，其外貌是一样的.由此推出，如果我們賦予 U + &)! 种排 
列中的每一种以槪率 1 /U + 幻！，則全部可辨別的排列都是等可 
能的，而且每一个都有槪率4- 因此，如果我們說 

到关于等可能的排列，它旣代表可辨別的排列又代表这些元素的 
全部排列的总体.（可把沱和球随机放入盒中的情形作比較—— 
参看第5节 .） 

定理 2 . 令〜 • • • ，为滿足 

+ r 2 +*••+/々 =；»， ti ^ 0 (4.6) 
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的整数.把一个包含《个元素的总体分成々个有序的部分(分为 
k 个子体），其中第一部分包含 n 个元素，第二部分包含 n 个元 
素，等等，这种分法共有 

-^- . (4.7) 

rxl r 2 \ •••?•々！ 

(数 (4.7) 叫作多項系数 .） 

t 注意：子体之間的次序是必要的，譬如（〜= 2, r 2 = 3) 和 
(n = 3, r 2 = 2) 代表不同的 分法； 然而，組內之間的次序是无关 
紧要的.「司时还要 注意： 0 ! = 1 ,所以~等于 0 时幷不影响公式 
(4.7).] 

鉦.反复利用 （4.3) 可以証明数 (4.7) 能够写成下述 形式： 

(n )(» - n )(ra - r! - r 2 ) … (《 — r!- …— r*_ 2 ) (48) 

另一方面，为了作成需要的分划，我們首先从給定的 《 个元素中选 
取 h 个； 再从剩下的 n — h 中选取大小为 r 2 的第二組，等等.当 
第々一 1 粗选出以后，还剩下》—— r 2 — . • • —，々 -1 = Q 个 
元素，而这些元素就构成最后一祖.我們断言，构成上述分划的办 
法共有 (4.8) 所确定的数目那样多. 

例. （ e ) 爭呀.在一場桥牌中， 52 张牌分成四粗，每組 I 3 
张，因此，不同形共有52!(13!广 4 = (5,36—_) . 10 28 .訃 
我們計算每一个参与者都有一张爱司的槪率 . 4张爱司可以排成 

4! = 24种不同的排列次序，而每一种次序代表給每个参与者一张 
爱司.剩下的48张牌有 (48 1)(12!)— 种分配方式.因此所要求 
的槪率为 

24 . 48! . (13) 4 十 52! = 0.105.... 

( f ) 骰子.把 12 顆散子擲一次，可以产生 6 12 个不同的結 

• • 

果，它們都被賦以相同的槪率.每点出現二次的事件，卽把12个 
骰子按排成 6 耝，每組 2 个.因此，这事件的槪率为 12 !/( 2 6 • 6 12 ) 
— 0,003438 - - •. 

(在定理 2 中，町以允許 r , = 0 , 因此实际上"个元素常分为 
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k 个或更少的子体. r ; > 0 卽恰巧分化为々类的情形将在問題 
11.7 处理 .） 


*5. 在占位問題中的应用 

第一章第2节的例子曾指出把 r 个球随机地 放人” 个盒中的 
模型具有广泛的用处，我們再回过来討論这个模型，当然，我們假 
定这/种可能的分布中的每一种分布的槪率都是—个特定 
的分布的最重要的性貭可以由它的占位数目来表示， 
其中 G 是放入第 *_ 个盒中的球的个数.其中 

q +，2 + . • • + r ” = r ， r ,- ^ 0 , (5.1) 

我們只硏究球是不可辨的情形.因此，球的分布完全_它的占位 
数来描述，两个分布只有当对应的有 序的” 維向量…，%)不 
相等时才可以区別.我們第一个目的是証明 

引理. 可区別的分布[卽是方程 (5.1) 的不同的解]的个数为 15 



沒有一个盒是空的可区別的分布的个数共有 

㈡). 

証.我們用》+ 1 条 I 把空間分成》个盒，而用 * 代表球. 
因此符号|***|*| I I 丨**** 1 代表这样一个分布： 
r = 8 个球放于» = 6 个盒中，其占位数为 3 , 1 ， 0 , 0 , 0 , 4 .这 
样的符号的开始和終結必需有一条 I ，但是其佘的条 I 和” 
个*可以按任意次序出現.用这种方法可以看出，可区別的分布 
数等于从 n + r — I 个位置中任取 r 个位置的选法.沒有一个 
盒是空的相当于沒有两条 I 靠在一起.但》•个星之間空出 r — 1 
个位置，而这 r — 1 个位置中有« — 1 个被 I 所占位，因此，我 

們有(^= ^种可能的选择，这就証明了我們的引理. 

* 这一节的內容是很有用的，而且是富有启 发性的 ，不过以后不是明显地用到. 

1) f = 100, » = 4的特例在第一章例 C 2. e ) 中应用过. 
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例. （ 0 擲， 个不能辨別的骰子，可以分辨的結果共有 
(1 5 )个. 

( b ) Mffc . 一个” 个变元的解析函数/(^,…，; o 的， 
阶偏导数‘其求导数的次序而只依賴于对每一个变元氽导数 
的次数.因此，每一个变元对应于一个盒，所以不同的 r 阶偏导数 

共有 p : — 1 j 个.一个三元函数的 4 阶偏导数共有 15 个， 5 阶 

偏导数共有 21 个. 

把 r 个球放入 w 个盒中是对 r 个球的总体的一神分法.由 
第4节定理 2 可得知：具有占位数〜‘‘ •，〜 的分布共有 r \- i - 
( ri ! • r 2 ! •••%!).这个公式仍然包含了占位数的次序关系，但 
是，这神次序常常是非本貭的.下面的例子就是想用来說明解决 
許多初等的組合問題的簡单而常用的方法. 

例. （ c ) 把 r = 7 个球放入 w = 7 个盒中的形式.（这些 
盒可以理解为一周的 7 天，这些球可以理解为呼喚，信件，意外的 
事件，等等 .） 为了簡洁起見，钍我們考虑一个以任意次序出現的占 
位数为 2, 2, 1, 1，1，0, 0的分布.这 7 个占位数把7个盒分为 
三个子类，它們分別为有两个盒两次地被占位；三个盒被占位一 
次；两个空着的盒.这样把卞們分为三羣其大小各为 2, 3, 2 的分 
法共有 7! + (2 卜 3 卜 2!) 种.而对每一种給定的分法，把 7 个球放 
人这 7 个盒中的方法共有 7! + (2! • 2! • 1! • 1! . 1! • 0! • 0!) 
= 7! + (2! • 2!) 个不同的分布.所以用某种次序出現的占位数 
为 2 , 2 , 1 , 1 ， 1 ， 0 , 0 的不间的分布共有 

—^X (5.3) 

2! • 3! • 2! 2! . 2! 

注意： 这个結果曾經由 （4.7) 的双重应用（旣对球，又对盒）而推出 
过.同样的結果可以用很多种方法推出和表述，不过現在这种方 
法对很多种类型的問題提供 T 一种最簡单最常用的技巧（参看第 
10节問題 43—45). 表1包含类似（ 5 . 3 )的內容，而且还包含在 
r = « = 7的情形下各种占位数的一切可能形式的槪率， 


• 40 • 



表 1. 1 个球放入 7 个盒中的随机分布 


占位数 

排列数等于 
7! 父 7 !除以 

概率 ( 排列数除以 7 7 ) 

1， 1， 1， 1， 1， 1， 1 

7 !Xlr 

0.006 120 

2, 1， 1， 1， 1， 1, 0 

5! X 2! 

.128 518 

2,2,1,1,1,0,0 

2!3!2!x2!2! 

.321 295 

2, 2,2, 1,0, 0,0 

3!3! X 2!2!2! 

.107 098 

3, 1，1，1，1,0, 0 

4!2! X 3! 

.107 098 

3, 2, 1，1,0, 0, 0 

2!3 l X 3 J 2 I 

.214 197 

3, 2, 2, 0,0, 0,0 

2!4! X 3!2!2! 

.026 775 

3, 3, 1, 0, 0, 0, 0 

2!4!x3!3! 

.017 850 

4，1，1, 1,0,0,0 

I 3|3! X 4 f ' 

.035 699 

4, 2, 1，0,0, 0,0 

4! X 4!2! 

.026 775 

4, 3, 0, 0, 0, 0, 0 

5! X 4!3! 

.001 785 

5, 1，1，0,0, 0,0 

2!4! X 5 l 

i .005 355 

5, 2, 0, 0, 0, 0, 0 

5! X 5!2! 

.001 071 

6, 1，0, 0, 0, 0, 0 

5.1 X 61 

.000 357 

7, 0, 0, 0,0, 0, 0 

6! X 7! 

.000 008 


关于波司-爱因斯坦和弗米-迪拉克統計的注. 到現在为止，我們一直 

假定 〆 种可能分布中每一个可能分布的槪率都是事实和經驗都迫使 
物理学家拋弃这种假定，而以各种不同的方法賦以槪率. 

考虑一个力学系統，它具有〃个不能分辨的貭点.在統計力学中，常常 
把相空間分成”个小区域（或者盒），”是很大的，因此，毎一个分子总处于 
某一个盒中.用这种方法，整个系統的情况以个分子放入”个盒的随机分 
布来楢述.乍一看来，似乎(至少对》个盒造当的定义) 全郡 〆 个排列都具 
有相同的槪率.如果达是对的，那末，物理学家把它叫作馬克司威尔-波茨曼 
統計(这里所用的“統計”一詞是物理中的未語).人們曾經花费过很多力量 
要想証明物理貭点是按照馬克司威尔-波茨曼的統計法則行动的，但是現代 
理論无可置疑地表明，这个統計法則对于知識范围內所知的任何貭点都是不 
适用的；在何任情形下，那 〆 种排列的槪率都不是近乎相等的.于是，人們 
另外引进两个槪率模型.这两个槪率模型各自地能够滿意地描述某一类型 
的貭点的动态.应用的时候，哪个成功就用哪个.两个模型都不是放之四海 
而皆准的.說不定有一天，对于某些种类的貭点人們还会弓 I 进新的模型. 

必須記住，現在我們只討論那些不可分辨的貭点.設有 r 个貭点和”个 
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盒.所謂波司 - S 因 斯坦統 計法則，就是只考虑那些可区分的排列，而每个排 
列都賦以相等的槪率 



在統計力学中，己經証明达个假設对于含有偶数个基本貭点的光子、核子和 
原子都是正确的(参看 [ 9]). 为了描述另外一些貭点的情况，我們要引进第 
三种賦槪的方法.弗米-迪拉克統計是基于这些 假設： （ I ) 2 个或多个貭点 
在同一个盒中是不可能的； （2) 滿足上一个条件的所有的可区分的排列具有 
相同的槪率.这里第一个假定要求 r 在”. 毎一种排列都相当于》个盒中某 
r 个各含一个貭点，也就是說，每一种安排相当于从》个盒中选取，个.因 

此，共有神不同的安排.根据第二个假設，毎一种排列都具有槪率 

(") _1 . 这个模型可以应用在电子、中子和貭子上.这个富有敎育性的实例 

吿訴我們，光凭先驗的論証来选择或判明槪率模型是行不通的.事实上，沒 
有任何的抽象推理可以說明为什么光子和貭子幷不遵从同一个槪率規律. 
(馬克司威尔-波茨曼統計法則和弗米-迪拉克統計法則之間的基本区別将在 
第11节問題 M —19中闡明 .） 

在馬克司威尔-波茨曼統計中，把盒1, 2 ,…，”各包含，1，…，〜个 
球的槪率加起来(其中 n + ••• + 〜 = r ) 就等于 

- r J - (5.5) 

ri\ . 广 2 ! • • ^ n \ 

在波司-爱因斯坦統計中，这个槪率由（5 〆 ）所給出；而在弗米-迪拉克統計 

中，这个槪率等于其中每一个〜都为。或为1.注意，“馬克司威尔- 
波茨曼統計”是物理学家的語言，我們把它叫作球放入盒的随机排列. 

例.（ 3 )令 b = 5, r = 3. 按照馬克司威尔-波茨曼、波司 - 爱因斯坦、 
■弗米-迪拉克三种不同的統計法則，棑列 （* 丨 一1*1*1—) 分別具有槪率 

g 或占. 也可以参看第一章例 (6. b ). 

( b ) EfJJg . 一本书中包含了”个符号(字母），其中》•个是印錯的.錯 
字的分布对应于 r 个球放入” 个盒的分布（毎一个盒不可能有多于一个球） • 
因此,有理由 假定： 錯字遵从弗米-迪拉克統計法則(参看問題 10.38). 

*S» .应用到連貫中去.二类元素按任意次序混合排成一列，其中毎个 
由同类元素所組成的不能再长的小段称为一个毕覃.例如，在序列 讎 ㈣ 
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卵押中 ，开始吋，有长度为 3 的一个 a - 連貫，其后有四个連貫，长度依次为 
1, 2, 3, 1. a - 連貫和/3-連貫是相間的，因此，連貫的个数总是等于异类相 
邻的总次数加 1. 

連貫理論可以有很多方式应用到統計中去，不过，其主要 
用途 ikii 士 ‘随机性检驗和齐次性检驗之間的联系. 

(a) 早声取 学學寧宁，問題是要判断一次給定的覌察是不是随机的，或 
者是不是起作用.作为一个簡单的例子 L1 ° ] ， 我們假定一个 
人覌察餐桌用餐情况.他用 S 表示盎座，0表示被占座，給出了如下的一个 
記录： EOEEOEEEOEEEOEOE . 値得注意的是，沒有2个被占座位是相邻的. 
这可能是偁然的嗎？因为对于5个被占座位和11个容座而言，連貫的个数 
不可能多于11个，而这个記录恰巧就是有11个連貫的极端情形.以后，我們 
会指出，如果所有的排列都是等槪的話，出現11个連貫的槪率只有0 -0578-. 
这个小槪率在某种程度上符合了这种預感，那 就是： 所覌察到的那种分离 
現象是有意的.这样的阡疑虽然不能用統計的法則加以証明，但是如果継 
續覌察下去,就可以收集到更多的証据.如果餐厅常常有家庭頋客用餐，那 
末将会有成羣地集中占領座位的傾向，因而会出現个数（相对地）較少的連 
貫.同样，如果把敎室里男孩和女孩的連貫計算一下，就也許可以发覚他們 
浪•合的情况不是随机的.难得出現的排列竟然出現，可以給出一些綫索去寻 
求系統 原因： 連貫的数目过多就表示人为的故意浪■合；連貫个数太少表示人 
为的放意集結.当然，这些結論幷不是很可靠地成立的.但是，有效的統計 
技巧已經大大地发展了，它在实践中大大地縮小了作出錯誤結論的危险性 . ： 

休哈特把連貫理論应用于工业上的貭量控制中.当橡皮垫圈制成之后， 
其厚度各不相同.厚垫圈的长串（长連貫）的出現，可能反映生产过程不够完 
善，因此，引导我們去消除不完善的原因.这样就能防止卽将到来的毛病，而 
使得产品达到高度的均句性. 

在生物的現場实驗中，我們計算健全作物和有病作物的連串，有病作物 
的长連貫提示疾病的菱延.气象学家留心干燥和潮湿月份的連續現象 [11] , 
借以发現气候的持續現象的綫索. 

O ) 为了了解典型的齐次性問題，我們假定两种菇給两組病人服用，或 
者說我們想比較两种处理（医葯上的，农业上的或工业上的）的效果.在实践 
中，我們有两組覌察結果，譬如說 •••,〜* &，牝， •• •，玛分別 
对应于两沖处理或者說分別对应于两个总体中的元素的某一特性（例如重 
量），《和戶都是数，我們假定它按大小次序 排列： ••<«.,； 芦1< 




我們把这两組数合在一起,幷按大小次序来排列.一个极端 
的情况是全部 a 都在全部 )3 前面,这种現象可以用来指出达两种处理或这两 
个总体之間有差异.另一方面,如果两种处理都是一样的，則《和卢或多或 
少以随机次序出現.瓦尔德 (A. Wald) 和牮尔夫維茨 [12】 曾經証 明了： 連貫 
理論常常能很方便的利用来发現微小的系統誤差.（一个用不同的方法处理 
的例子見于第三章第一节 .） .... 

許多关于連貫的問題都可以用一种极簡单的办法解决.給定 * 个不可 

区分的 a 和6个不可区分的/3,則有 ( a + *) 个可以区分的次序.如果有 

”！个《-連貫，則連貫的个数或則为 »1 + 1,或則为 《1 — 1,或則为 
把《个 a 安排在个連貫中等价于把它們安排到 "1 个盒中去，它們中間沒 

有一个是空的.由最后一个引理 得知： 这种安排法共有(^二^种.由此推 

出，具有〜个連貫，…+ 1 个連貫的排列共有 G 二 DC :》（在第 
11 节問題 20— 25 中坯要継 縝）. 

( c ) 在物理学中，用連貫理論来硏究合作現象，在艾辛 ( Isingr ) 的一維点 
陣理論中，能量依賴于“异类相邻陣点”的总数，也就是說依賴于連貫的个数. 


6. 超几何分布 


很多組合間題可以归結成下面的形式.在《个元素的总体 
里， 》 1 个是紅的， n 2 = n — n x 个是黑的.任意抽出一組 r 个元 
素.試求所取出的这一組中，恰有々个紅元素的槪率这里，々 
是正整数，它的取値范围是从0到 min ( r , Wl ). 

为了求出以，我們注意到，选取的这組中，包含着々个紅元素 

和 r — 々个黑元素.紅元素的选取有个不同方式，而黑元素 

有(^ = ^)个方式.由于々个紅元素的任意一种选法都可以和黑 
元素的任意一种速法配合，所以我們得到 
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( 6 . 1 ) 



如此定义的这一組槪率，就称为超几何分布 n . 利用 （4.3) 式，可以 

• 蠢 ■ » • 

把 (6.1) 写成 


认= 



( 6 . 2 ) 


辻.槪率如只对々的数値不超过》•或 A 而定义的，虽然如 
此，但从定义 (4.1) 可以推出：当 b > a 时 (^) = 0. 因此，当 

K > h 歲 k > r 时， （6. L ) 和 （6.2) 式都給出价= 0. 于是 ，（6.1) 
和 (6.2 ) 的定义对所有的都可以应用，只要把关系办= 0 
的出現解释为其所对应的事件是不可能事件就成了. 

例. 0) 在工业的貭量控制中，产品分批进行抽 

样检查，每批由： 祖成.在一批中，次品就以“紅”元素代表 

之.当然，它們的数目 A 是未知的.在取出的大小为，‘的一个样 
本中，次品的个数々是完全确定的.于是， （6.1) 式可以使我 們对内 
的値作出槪然的估計;这是統計估値的一个典型問題，但它 E 超出 
了本书的范围. > 

( b ) 在例 (4. b ) 中，由《 = 96位参議員組成总体，有 «1 = 2 
位是指定的那个州(卽“紅”的）的参讓員.任意选取 r = 48位为 
—蛆，其中包含指定的那个州的代表可以有々==0, 1或2位.从 

(6.2) 式，我們可以得到記住由 （4.4) 式給出的(^) = 1) 

48 • 47 

a Q = ， ■ 上 = 0.24737--, 


= — = 0.50527 • • • , 

48 • 47 

q 2 = -= 0.24737. * 

96 • 95 

例 (4. b ) 中也得到过办的値，但是方法不同， 


0这个名字可由以下事实来作解释：{奴}的母函数(参閱第十一章）可以用起 
何函数来表示. 
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( c ) 假設从其 

一个湖里，.捉•出龜4,•涂•以•紅•点•后•放•回 •. •隔了一个时間以后， 
重新又捉出1000尾魚，发現其中有100尾涂有紅点的魚.根据这 
些情況，对該湖中魚的总数能作出什么秸論呢？这是替計年 f ; 的 
—个典型問題.如要叙述近代統計中用到的各种方 法*， 題 
太远.現在我們只想說明一下，超几何分布是怎样供給我們綫索 
来解决問題的.我們自然要假定，这二次捕捉都考虑为从湖中所 
有的魚組成的总体中所作的随机柚样.（实际上，这个假設排斥了 
下面的二种 情況： 二次捕捉都在某一个局部的区域进行；二次捕 
捉之間相隔的时間太短 .） 我們还假定，在二次捕捉期間，湖中魚的 
总数是常数. 

为了使問題一般化，我們考虑任意大小的样本，令 
» =湖中魚的总数（未知的）； • 

«!=第一次捉出的魚数，它們相应“紅 球”； 
r = 第二次捉出的魚数； 

K =第二次捉出的魚中紅点魚的总数； 

办 (《) = 第二次捉出的魚中恰有 々尾紅 点魚的槪率. 

这样一来，我們馬上看出，以 (《) 是由 （6.1) 給出的.实际上， 
叱，7•和々是可以覌察到的 ，而” 是未知的.注意，肅便再提一下， 
n 是一个定数，它不是随机遇而改变的.所以，如果要問》大于某 
数(譬如說 6000) 的漑率为何，那是毫无意义的.但是我們知道， 
曾經有 tii + r — k . 尾不同的魚被捕到过，因而 n ^ n x + r — 
这就是預先可以作出肯定判断的全部/在我們的例子里，^ 
= 1000, k = 100,因此湖中只有1900尾魚的假定是可以考虑的. 
虽然如此，我們假如从这个假定出发，导出来的結 論是： 发生的事 
件的槪率小得惊人.事实上，大小为1000的二次样本，取尽了整 
个总体中的1900尾魚，其槪率由 （6.1) 可知为 


I )这个例子在第一版中就采用了，伹是当然我不知道这个方法在实际里已經广泛 
采用.关于这方面的新的貢献請参看文献 N . T . J . BaileyrU ] 和 D . G . 
Chapman [141 
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(loop ；) 2 


( 1000\/900\ 

V 100 7\900/ 

/1900\ 100! 1900； 

\ioooJ . 

由史特令公式（参閱第 9 节）可以証明，这个槪率的数量級将是 
10_' 因此可以孰为，我們的假定不合理而加以否定.同理可 
知，《很大（譬如說 1,000,000) 的假定也一样会被否定的.經过这 
样的考虑，迫使我們去寻求使 q K in ) 达到最大値的那个《，由于那 
个”能使我們的观察有着最大的槪率.对任意一組特定的覌察値 
» x , r , k , 使 w («) 达到最大値的那个》就記作&幷称为》的辱木 
尽窄宇审寧.这个槪念是由費歇 （ R . A . Fisher ) 所引进的 . ilT 
找出考虑比値 

价 (w) = in — «i)(w — r) ( 6 . 3 ) 

q\(ji — 1) (« — n\ 一 r + !^)n 

由簡单的計算可知，这个比値大于或小于1，分別按照畎 </V 
或 nK > n^r 而定 • 这就是說 ，当” 增大时，序列❿ (《) 先是上升 

而后下降；当《为小于•的最大整数时，它达到最大値.因此邊 

大約等于 I . 在我們的特殊例子里，魚数的最大似然率估値为 
K 

n = 10,000. 

» 的滇値 可能大些或者 小些; 我們可以找出这样一个范围，使 
得我們可以合理地 期望” 落在这个范围之內.为此,钍我們来检 
驗” 小于8500的这个 假設. 把 n = 8500 ，〜= r = 1000代入 
(6.1) 而进行計算，在第二次样本中含有100尾或較少的紅点魚的 
槪率.这槪率为= ?。+ ft + _ • • +办00.直接計算这个 z 是很 
麻煩的，如用第七章的正态近似法，就可以很容易求出 x 〜 0.04. 
同样，設》= 12000,則在第二次的样本中含有100尾或較多紅点 
魚的槪率約为 0.03. 根据这些数字，可以推想魚的眞正条 数”大 
約处在8,500与12,000之間.还有其他的方法来推导迖些結論和 
进行估値，但是我們在这里就不細誹了， 
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由 槪率奴 的定义，可得奶+《1 + •••== 1. 因此，对任意正 
整数 « i 和，， （6.2) 藉含着 



这恆等式是常常用到的.对于正整数《和》•来說，算是把它証明 
了，但它的成立幷不受这个限制.实际上，当《和 r 为任意正、負 
整数时， （6.4) 都成立（叫必須是正整数，否則沒有意义）.（两个証 
明的提示在第12节問題8,9中給出 .） 

很容易把超几何分布推广到大小为《的原来的总体中含有好 
几类元素的情況.例如，假設总体中含有三类元素，其个数分別为 
»1, « 2 和》 — 以 一〜. 如果取出一个大小为 r 的样本，那么，这样 
本含有也个第一类元素，心个第二类元素和 r - ki - ki 个第，三 
类的槪率为（与 (6.1) 相似） 

(«iV n^\( n — n x — n\ 

-kr- U (65) 

、 （:） 丨 . 
当然，必須要有々1 < 打1，々2 < 和—々1 — k . Z^ n — n l — n 2 m 

例， ( d ) 桥牌. 52张牌的总体包含四个类，每类由+三个 

• • 

元素粗成.任发到一家的13张牌含有5张黑桃 ， 4张紅心 ， 3张 
方块 ，和 1张梅花的槪率为 


( 








7. 等待时間的例子 

在这一节里，为了考虑一些新型的样本空間，我們将避开組合 
分析的直接道路，把占位問題稍許变化一下就可以得到这样新型 
的样本空間.我們再一次地考虑把球随机地放入《个盒这个槪念 
化了的“試驗然而，这时我們事先幷不固定球的个数 r ， 而是 ft 
球一个接一个地投入小盒 ，一 直到我們指定的結果出現为止，我 
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們将要仔細考虑下面两神可能的結果： （0 球一个接一个地往盒 
里随机地放，一直到有一个球放入某一个已經有球的盒为止.这 
个过程一直到有一个盒已經放入一个球时才結束. （ H ) 我們固定 
一个盒(譬如說，第一个盒），当这固定的盒还空时，我們就随机地 
放小球入盒，也就是說当这个盒一旦放入球时，达个过程就停止 . 

只要把这个模型稍許解释一下就会說明問題. 

例. （ a ) 丰尽.在例 ( 3 . d ) 中，一年中 365 天对应为 
365个盒，人对球.我們的模型 (0 現在可以这样說；如果我 
們一个接一个地随机地选人，問需要抽多少次才能发現有两个人 
同一天生日？模型 （ ii ) 輪到我的生日在样本中出現时需要抽多少 
人. 

( b ) —个人想打开他的門.他有”把朗匙，但是 
只有一把能的門.由于他事先不知哪一把能打开門，他随 
机地用这些钥匙去試开，因此，每一把钥匙在每一次試驗中被抽到 
的槪率都是^ 1 ，而且含有同样多的試驗次数的全部可能結果都是 
相似的.这个人恰巧在第》•次試驗把門打开的槪率是多少？这是 
模型 ( ii ) 的一个特別情形.把这种作法与問題 （10.11) 的更系統的 
探討比較一下是很有趣的;也可参看 V ，問題5 . 

( c ) 在前面的例子中，我們可以用从任意的总>体中抽样来代 
替从朗匙中抽样，譬如說，我們可以用收集贈券来代替抽取钥 
匙.我們 再問： 我們可望什么时候出現第一次重复，我們指望的 
那一张贈券第一次出現是什么时候. 

( d ) 在第一章例 （ 5 . a ) 中，一个錢币一直扔到 
出現正面 i ▲模型 G ;) 当« = 2的一个特殊情況.擲一顆 
骰子，一直到第一次出覌么点为止，这也是模型 ( ii ) 当《 = 6的一 
个特例.（在第10节問題21，22, 36;第11节問題12还考虑了 
其它一些等待时間 .） 

我們首先討論槪念化的簡单的模型 （ i ). 为了方便起見，我們 
利用符号 h , / r ) 表示第1,第2, •…，第，个球放入第 a ， 
h , ..，, j r 个盒：而且过程在第『次試驗結束.这就意味着都是 
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1 到” 之間的 整数； 此外 a ，• • •, / r _! 都是不相同的，但 y , 等于 
h , • • - , 7,-1 中的某一个.每一个这样的排列都代表一个样本点. 
因为第一次出現某一个盒已經放了球不可能发生在第二次放球以 
前，也不可能发生在第 » + 1 次放球以后，所以， r 只可能取2, 
« + 1中的某一个値.現在的間題和过去老的模型(把固 
定数目的球放入》个盒中）之間的联系使得我們对每一个恰巧包 
含 r 个球的样本点賦以槪率我們将要 証明： 这种作法是允 
許的（卽是这些槪率加起来等于1)，而且它可以推出許多合理的 
結果. 

对于一个固定的 r ， 全部形如 , j r ) 的样本点的总和代 
表事件“过程在第 r 步結束”. 数 h , 可以有 («) r - X 种不 

同的选 取法; 而 A 只能取八， • • • , jr-l & r-1 个数.由此推出， 
过程在第 f 步結束的槪率为 


= («)r-l • (r — 1) _ 

n T 



(7.2) 

上式可以用归納法得出.特別地， ? B + i =0, 和负 + — +% +1 = 1 
是显然的.此外，当» = 365时，公式 (7.2) 推出（3.2)，一般，我們 
的新模型可以得出前面包含固定个数的球的模型的同样的結果. 

模型 （ ii ) 与模型 （ i ) 之不同点在于模型 ( H ) 要依賴一个无穷的 
样本空間.序列 （ A ，• * • ， / r ) 現在都滿足下述 条件： 都 
不等于給定的数《 < »，而 A = 此外，沒有充分的理由說明 
过程为什么将要結束.对于一个固定的 r ， 我們可对每一个形如 
(/!,•••,/；) 的样本点，都賦以槪率 A ， ' ' • , ； V - i 中每一个都 
有《 — 1种不同的选法，而的选法只有一种.所以过程在第， 


其中奶 = 0, q 2 = —. 过程在第，步以后結束的槪率 /V 

n 

(负 +《2 + ■ • • +， 或者= 1， 
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步結束的槪率为 

q * = ( n ~ •丄， >• = 1, 2, • • •. (7.3) 

\ n / n 

把这个几何級数加起来，我們发現^ + ■ • • = 1. 因此，这 

拽槪率之和为1，所以，我們沒有必要引进一个样本点，它代表从 
来沒有一个球放入給定的盒《 . 过程在第，步以后才結束的槪率 
p? = I — iq* + + qf), 

因此,我們有 

pr* = (1 — I) , r = l ，2, …， （ 7.4) 

这是我們所期望的. 

分布和的中位数我們定义为这样的 G 它使 Pr,pt ^ 

—附近，大致上說就是这样，过程在中位数以后还継續的槪率和 
2 

在中位数以前結束的槪率差不多 .（ 在例 (3. d ) 中，中位数为 r = 23.) 
为了計算中位数，正如我們在 （3.4) 中所作的一样，我們要取对 
数.当^相对》来說較小时，我們看出 一 logp r 差不多等于 r 2 /2 n . 
这就推出{以的中位数大致 上等于 * 2 . I 0 g 2) i ， 或者近似地为 

有趣的是，当总体的大小的平方根增加时，其中位‘数也增 

力口.为了比較， { p ?} 的中位数大約为》 • log 2, 成 0.7/ f , 它对《是 
綫性地增加.在模型 ( ii ) 中，等待时間起过《的槪率为 （1 一 » -1 )% 
或者近似地 为厂 1 = 0.36788- 

8. 二項式系数 〔 ■ 

当《是一个正整数时，我們曾經使用过二項式系数但是， 

可以很方便地把它的定义推广.方程 （2.1) 中所引进的数 0) r: 

《 ( x) r — x(x — 1)， . *(x — r + 1) (8.1) 

当 r 是一个正整数时对一切实数^郡有定义.当 r = 0 时，我們 
令 (^)o =1,于是 
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(O r _ x(x 一 l)■ ' *(x 一 r + l) 

r T r I 


( 8 . 2 ) 


对全部实数 Y 和全部正整数 r 定义为二項式系数.当 r == 0时 3 
如 （4.4) 一样，令= 1和0! =1. 对于負整数 r ， 我們定义 

(二 ) = 0 (r < 0). (8.3) 

如果 r 不是整数时，我們不用这一符号. 


利用这个定义，我們很容易地驗証 


V 


(― l ) r ， 


(一 lXr + 1). 


(8.4) 


下面将要用到三个很重要的性貭.第一，对于每一个正整数 

»来說 

0 = 0 当7"〉》或广*<0. (8.5) 

第二，对每一个 r 和每一个正数 r 来說 

(r-l) + (") H. (8 ' 6) 

这些关系都可以由定义直接驗証.下一个关系的証明在一些微积 
分教科书中可以 找到： 对于任何数《和一切 一 1 < ( < 1，我們都 
有牛頓二項式公式 

(1 + O a = 1 + + d 2 + ( i ) t 3 + …. (8.7) 


如果 《 是一个正整数，右端諸項中次数高于，的項都为0,从而公 
式对一切£都成立.如果《不是正整数，右端是一个无穷級数. 
应用（8.4)，我們发現当 a = - I 时，展式 （8.7) 化为儿何級数 


1 —— t t 2 —— c s + — + . • * . 


■1 < ^ < 1 . ( 8 . 8 ) 


积分（8.8)，我們得到另外一个公式，它在以后是很有用的，这个公 
式就是自然对数的泰勒展式 

log (1 + ^ — ― t 2 + — t s — — t 4 + •.. ， 

2 3 4 
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— 1 < r < 1, 


(8.9) 



(8.9) 的两个另外的形式更常用.以一£代卜我們得到 


— 1 <«< 1 . 

把最后这两个公式加起来我們得到 

丄 log 1 十/ = t + — + — t b + • * • J 

2 1 — ( 3 5 


( 8 . 10 ) 


— 1 < # < 1 . ( 8 . 11 ) 
当 0< z < l 时， （8.10) 右端的数大于 M 旦是小于 t + t 2 + 
,3 + ... = , /(1 因此，我們有双重不等式 


e w <1 — t< e~ l , 0<z<l. (8.12) 

在第 12 节中，将要从 （8.7) 推出許多有用的关系和恆等式.这 
里我們只注意〃是正整数的情形，这时令# = 1,我們发現 



这个公式有一个簡单的組合 解释： 把一个 具有” 个元素的总 
体分为两羣，第一羣的元素个数可以为^ = 0, 1,-- •, «时，其分 
法的数目等于这个公式的左边.另一方面，这样一种分法可以直 
接考虑每一个元素或者属于第一羣或者属于第二羣.（类似的推 
理 証明： 多項式系数 (4.7) 相加等于々".） 


9. 史特令公式 

分析漑率論的一个重要工具蘊含在下述著名的定理 [15] 中： 

史特令 公式： 

«! - (2兀) W ”， (9.1) 

其中符 号〜表 示两边之比当 co 时趋于 1. 

这个公式是非常有用的，因为它有很大的理論价値，幷且通过 
它可以得出一些精确的数値估計.确实， （9.1) 两边之差可以超过 
任何数，但是其相对誤差却是很小的.它下降得很迅速，甚至当《 
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很小时，史特合逼近都很精确.事卖上， （9.1) 的右边以 0.9221 来 
逼近1!，以 1.919 来逼近2!,以 118.019 来逼近5! = 120. 其相 
对誤差分別为8%, 4%, 2%.对10! = 3,628,別0来說，其近似 
値为3,598,600,其相对誤差为0.8%.对100!来說，其相对誤差 
只有0.08%. 

史特令公式的証明.我 們考虑 

a„ = log 2 + log 3 + + log {n — 1) + — log n (9.2) 

2 



它与 log «! 之差只有最后一項的丄倍.我們将要証明〜表示二 

2 

个不同的多边形的面积的差，而且由这一点給出 log W ! 的两个界. 
图1說明« = 4这 一特殊 情形的情況. 写 成下述 形式： 


- { log 1 十 log 2} 十一 { log 2 -h log 3} + - * , + 
2 


— { log {n — 1) + log n} 
2 
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(9.3) 






后，則易看出，〜等于嫱点为曲綫 y - logx 上的橫坐标分別为 
1，2, 的点本 ，為，…，水和％軸上的点 0,0) 所构成的 

梯形的面积.这个梯形在曲綫的內面，因此，它的面积小于由这条 
曲綫， * 軸和 x = n 这条直綫所围成的区域的面积. 

另一方面，】 呢 々等于底边为 々一丄 <$<々 +丄，且界于 

2 2 

曲綫在点 A k = U , log 々） 的切綫下的梯形的面积.由此推出， 

log (» —1)； 大于由 y = logx , x 軸和垂直綫 : r = — 和 x = »— 丄 

2 2 

所围成的区域的面积.因为，显然 1' log * 大于条形区域 ”一丄 <* 

2 2 


< n 在曲綫下的面积，所以〜大于曲綫 一？… 和-軸 


所围成的面积.換句話說，我們証明了 

J log x dx<. a n < ^ log jc dx • 


(9.4) 


log ^ 的不定积分为 xlo^x - r , 因此方程 （9.4) 化为二重不等式 


+ —log n — /Z + 立(1 — Log <C log n t 


< 


< + ~2 J°^ n — n + 1. 


(9,5) 


为了簡省起見，令 


dn = logw ： 


I log» + n 9 


(9.6) 


于是 1 一 是 （9.5) 最右边的数和 Iog ^ i 之差，也就是說 ， i — 

等于曲綫 y = log ^ 与多边形 A x A r - A n 之間的面积.由此推 

出，<5„是单調下降的.但是，由 （9 . 5) 我們有含 (1 _ io g |-) < s „ 

<1. 所以我們断言， I 趋于一个界于1和音 (1 — log 音)的极 

限.把这个极限用 log e 来記之，則我們有 

d 0 logc ? 其中 2.45 < cr < 2*72. (9.7) 
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用对数的符号来写的話，史特令公式化为 （9.7), 其中 e ==(2; r )4( 或 
者近似地为 2.507). 因为 Jr 可以用很多不同的方法定义，为了我 
們的目的，最簡单和最自然的是定义《= 利用这个定义，我 

們就得到史特令公式，但是，还留下一点需要証明，那就是迖样定 
义的常数是否与 r 的其它公式一致.这个事实留在第七章中来証 
明，因此，我們完成了史特令公式的証明. - 

精确化. 史特令公式可以通过增加一項来进一步淸确化.虽然我們幷 
不需要应用如此精确的公式，但是，我們仍然在这里給出下列.的二重不等 
式 [ %的証明 


(2»r)*n 0+ ^ir" B+1/ C 12 »+ 1 )<n] < (2^)^n n+ ^e~ n+1/12n % 

为了証明 （9 .8)，我們注意： 


S n — = 




(9.8) 


_ 1 
~ 3(2a + I) 2 

(最后一个式子在 (8.11) 中令/ = 


5(2« + 1)« 


(9.9) 


1/(2« + 1) 卽可推出）.我們把 (9.9) 最 


右边的和的各項系数 \ ，- 都增大为+，这就变为公比为(2»+1广 2 
的几何級数，因此 


5 . - 5 *+> < 3 [( 2 „ + 1 1 ) 2 _ 1 ] = 1^~ 12{n + 1 ) - (9 ' 10) 

所以，心一 1/12»单调上升.因为这个序列的极限由史特令公式所給出， 

取逆对数，我們就得到 (9.8) 的第二个不等式.第一个不等式可以由 （9.9) 用 

类似的办法証明，这时， R 需注意 

s * — 5, +1 > —~~!——-3>-----5 - • (9.11) 

+ 3 { 2 n + I ) 2 12 » + 1 12 (» + 1)+1 

逼近式 (9.8) 是很精确的，甚至当1时,这个公式所給出的两个界都 


是 0.9958 …和1.00 2 3_". (9.8) 中給出的上界还稍为好一点(参看 （12.28)). 
当 ” = 2时，它給出 2.0007; 当》= 5时,我們得到 120.01...; 当” =10 
时，其前5位有效数字都芷确. 


問 題 

注意： 第11,12两节包含着不同性貭的問題以及課文的各种补充. 
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10. 練习和例子 


注意：在每一种情形都假定所有的排列具有相同的槪率. 

I .若每一个人的名字 1〗 ： （ a ) 恰巧有2 个字； （ b ) 至多有2 个字；⑷至多 
有3个字;試問姓名不相同的人共有多少？ 

、2 •不同顏色的2个城形棋子（国际象棋），在棋盘上能彼此吃掉的放法有 
多少？ 

3 •电碼中，普通的字是以“长划”和“点”二种記号容許重复应用来表示 
的.問不超过10个記号可以表示的字有多少？ 

4 •毎块骨牌刻上2个数，骨牌是对称的，所以同一块牌上的数对是沒有 
次序的.如果用1, 2,…，》等数,問能刻出多少不同的牌来？ 

5•数1,2,…，”依任意順序排列，試求数 列中： （ a ) l 与2; ( b ) l ,2 和 
3,以 ( a )，（ b ) 为序相継出現的槪率. 

6. (幻在三个随机数碼中，一个数碼重复发生2次，1次或 •() 次的槪率为 
何？ （ b ) 对四个随机数碼的情形上述問題再作一遍. 

7. 試求在 r 个随机数碼的样本中，沒有二个数_相同的槪率 Pr , 幷用史 
特令公式，估計 PlD 的数値. 

8. 在4个随机数 碼中： ( a )0 不出現； ( b ) l 不出現； （ c )0 与1都不出現； 
(0(] 和1二数至少有一个不出现的概率为何? 令/和 8 分別表示事件 (》) 和 ( b ), 
試用 j 和 S 把其余的事件也表示出来. 

9. »个球随机放入》个盒中，問恰有一盒箜着的槪率为何？ 

10. —个停車瘍有12个位置列成一行.某人发現有8个位置停了車，而 
有4个接連(构成一个連貧)的位置空着.这种发現令人惊奇(是非随机性的 
表示)嗎？ 

II •一人有”个钥匙，其中只有一把能开开他的門.他逐个地用它們去 

g 开(抽样嘉无放回的)这可能要1次，2 次，… ，”次才能把門开开.証明这 
”种不同的結果的槪率都是1/». ' 

12 .假定》支手杖的毎一支都折断成一长一短的二个小段，把这2»个小 
段任意排成 ”对， 組成新手杖.試求：这些小段都連接成原来的样子的 
槪率； （ b ) 所有长的小段都与短的小段配对的槪率 2) . 

1) 以26个字母排列成人的名字——譯者注. 

2) 当細胞玻有害'的放射棧照射的时候，一些染色体就会破裂，它們的作用正如此 
习題中的“手杖”一样.“长的”那一边就是含有所謂中心体的那一边.如果两 
个“长”的部分相锫合或 两个“ 短”的部分相結合,那么此細胞就死亡.参看 [17] . 
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某工作人員在某一个星期里，曾經接見訪問 I 2 
次，所有•这险巧都是在星期二或星期四.試求該事件的槪率. 
(是否可以断定他只在星 g 二和星期四接見訪問者？） 

14( 續前）.迖12次問沒有一次是星期日，是否可以断言星期日他根 
本不会客？ 

I 5 ,—个匣子里，有90只好的螺絲釘，10只坏的蝶絲釘.如果从中任意 
取用10只蝶絲釘,恰巧都是好的螺絲釘的槪率为何？ 

16 •从 5 个記号 B , b, C, d , C 的总体中，抽取大小为 25 的一个样本，求 
样本中恰巧含有每类記号 5 个的槪率.幷把等同于数字 0 和 1 ， 6 等同于 
数字 2 和 3 ，等等，用随机数的表来校核这个結果 1 

17.若》个人站成一个横列，其中有』和 S 二人，問夹 在/和 S 之間，恰 
有 》• 个人的槪率为何？如果他們不是站成一列而是站成一圈，試証这个槪率 

与，无关，而且它就是一 

» — 1 

18 •把3顆骰子擲二次，每次出現点子的花样是相同的的槪率为何？如 
果： （0 骰子可分 辨的； （ b ) 不可分辨的，試分別求之. 

1 9 .試証，4顆骰子擲一次至少出現一个“么”点的可能性比2顆骰子擲 
24次至少出現一个双“么”点的可能性为大.（这个問題回答了所謂# •曼 
来的脖論.台•曼来是一个賭徒，他肽为达二个槪率应該是相等的，由于賭 
輸他曾譴賨过数学 .） 

20 •从一个由《个元素构成的总体中抽出一个大小为 r 的样本.求指定 
的 W 个元素不包含在样本中的槪率，假定 ( a ) 无 放回； （ b ) 有放囬的.当 （ i ) 
» = 100 ， r = N = 3; ( ii )» = 100 ， r = A 7 = 10时，比較上述两种抽样法 
所得到的槪率. 

21 - ISfWff -#. 在一个拥有1个居民的城市里，某一个人吿訴第 
二个人一_个^言_，士第二人又把謠言吿訴第三个人，如此等等.在每一步中， 
謠言的接收者都是随机地从”个居民中相 t 选的.求下述两事件的槪 率：誧 
S •传播了 r 次后， （ a ) 还沒有回到第一个造謠者， （ b ) 沒有一个人两次地听到 
謠言.当毎一次都把誧言同时吿訴由城市中随机逸取的 JV 个居民吋，問上面 
两事件的槪率等于多少.（最初的問題是 W = 1 的特別淸形 .） 

2 2 •予零印亭寧，竿.在一个具有„ + 1个人的集体里，有一个人 一 
‘‘祖先人——“第一輩后 代”. 而这两个人又各发两封信給 


1) 它們有时候是非常的相近，参看 [18], 


* 58 • 





如人，一般地，第 r 輩后代中的某一个人都随机地发两封信給別人.求出第1， 
2，…，，輩后代都不包含祖先的槪率.假定》充分大，求出分布的中位数. 

23 . 了个琴专哼呼 M . 某家有四个女孩，她們去洗食具.在打破的四个 
食具中有是小女孩打破的，因此人家說她笨拙.她是否有理由申辯 
这笋全是碰巧？討論这一題和球随机地放入盒中的联系. 

24. 求出下述两事件的 槪率： （ a ) l 2 个人的生日在 〗2 个不同的月份 C 假 
定任何一个人生于12 个月 中之任一月都是等槪的）； （ b ) 6 个 人的生日恰巧 
在两个月中. 

25 .給定30个人，求出12个月中有六个月恰巧包含两个人的生日；有六 
个月恰巧包含三个人的生日的槪率. 

26. —个房間里有》双不同型号的 鞋子. 今从其中随机地抽取 > 只 
(2 r <«), 求下面三个事件的 槪率： （ a ) 沒有一双同型号的； （ b ) 恰有一双同型 
号的； （ c ) 恰有两双同型号的. 

27. — 辆車子停在有 2 V 辆車子的行中間（不在两端）.当他过一会再囬来 
的时候，发現 N 个位置中恰巧仍有 r 个位有車.問两个相邻的位置是空的槪 
率为何？ 

28 .把拥有 2 W 个男孩和 2 N 个女孩的一羣孩子分为两羣，每羣各个 
孩子，求每一羣中男女数目相等的槪率欠幷用史特令公式估計 P . 

29.証 明： 在打桥脾中，坐在西方的人恰巧拿住々个爱司的槪率^与任 
取1 3 张牌其中恰有々个爱司的槪率相等.（直現上这是很显然的.不过耍 
注意，这两个槪率所考虑的試驗是不同的，因为在后一种情形中，13张牌是 
任意抽取的，而在前一种情形中，52张牌都要分配完的 .） 

30 .在桥牌游戏中，东家和南家各有«张黑桃的槪率和从整付桥脾中 
随机地取两付（毎付13张），第一付有《张黑桃第二付有《张黑桃的槪率同. 

31 •南北两家共有々个爱司（々= 0, 1，2, 3, 4) 的槪率为何？ 

32•令 a , e ， d 为滿足 a + i，+c + d = li 的四个非負整数，在一 
次桥牌游戏中，求东南西北各家分別拿到 h f 张黑铫的槪率 P ( a , 
c , d ), 推述一个把紅球黑球放入盒中的模型，而把这个問題作为一个特例. 

33 .利用32題的結果， 0) 当 a = 5，* = 4， C =3 ，</=l 时； 0 ) a = 
b = c = ^, i / = 1 时； (c)a = b = c t= S , d = 2 时，求出 p(a, b, c, d) 

之値. 

注意，这三神情况有本貭的区別. 

34 .令 fl ， *， r ， J 为滿足 a 十6十 c + d =13 的整数，求出在一付桥 
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牌中含有 a 个黑桃 6 个红心 c 个方块 和3 个梅花的槪率 g ( a ， b , r , d ), 共 
証明这个問題不可能化为一个把13个球随机地放入4个盒中的模型.为什 
么？ 

35. r 毕带呼宁學 兮市. 計算随机抽取^张桥牌，其中恰有 0 ， 1 , 
…，4张爱司的槪率 Po(r), pl ( r ), ■■■, p4(r) • 驗証 po(r) = p ^(52 — r ). 

36( 續上). mw & fm . 如果取出一张一张牌，求出第 1,“ .，第 + 张爱 
司在第 r 次抽取中 A 現的槪率 fi ( r ), ■■■, / 4 ( r ). 猜測第1，…，第4张爱司 
的等待吋間的中位数，幷从而算出它們来. 

37 .如果两付桥牌中每付都有 r 张，而且 0) 它們都是从同一付桥牌中取 
出的； 0) 它們从两付桥牌中取出的，試求每一付牌中恰有々个爱司的槪率. 
証明：当 r=13 时，問題 (》) 的槪率与指定两个桥牌游戏者各获々个爱司 
的槪率一样， 

38. 每一頁书中都有 W 个印刷符号可能誤印.全书共有«=500 
頁，，=/个印錯的符号.証明 （ a ) 第1，第2 ，…，第” 頁分別含有 n ， 
『2,…，〜个錯的符号的槪率等于 

CXHDO 

( b ) 当 N 充分大后，这个槪率可以用 （5.5) 来逼近，井推出〃个錯誤分布在》 
頁的問題近似地与 r 个球随机地 放入” 个盒的問題相 吻合. （注 意： 这个可 
以作为弗米-迪拉克統計的一个普遍的极限性貭.参看第5节 .） 

注意： 下面的問題与第5节的材料有联系. 

39 .若把 n 个不可分辨的第一类东西和 r 2 个不可分辨的第二类东西放 
人》个盒中，試求可区分的棑月 I 总数. 

40 .把 n 个骰子和 r 2 个小錢一起扔一次，試問有多少可以区分的結果. 
41.把 n 个白球，『 2 个黑球， r 3 个紅球进行排列，試問有多少种可以区 

分的排列方式. 

42 .把 52 张桥牌随机棑列，試問沒有两张爱司紧邻的槪率为何？ 

43. El .^. 在例 (3. c ) 中，在开始时載有7位乘客的一架电梯在有10层 
楼房的每一层上停留，这7个乘客出电梯有各种各样可能的排列，‘例如我們 
用 （3, 2, 2) 表示有三个乘客在某一层同时出去，另外又有两个乘客在另一层 
出去，最后两个乘客在某一层一同出去.这种可能的排列从 (7) 到 （ 1,1,1,1, 
1, 1, 1) 共有15种，試求出对应于这15种排列的15个槪率. 

求出2 2 个人的生日的各种不同形式的 槪率. 
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45 .如臬一付扑克恰巧是下列事件之一，試分別求其 槪率： 

( a ) 最大同花(“10”，“广，“0”， “ K ”， 为同一花 色）； 

(b) 四同点 （ 4 张牌的面値相 同）； 

( c ) 滿堂(有一对且有三张同面値）； 

( d ) 順子 （5 张牌的順序連續，但不考虑花色）； 

( e ) 三同点 （ 3张的面値相同与2张不同的牌）； 

(0 两对 （4 张牌成两对与另外的一张 牌）； 

( g ) 一对(两张牌同面値与另外三张不同的牌). 

11. 問題和理論性的附录 

1 .一个总体中有”个元素，其屮有个紅的叫个黑的0 + ? = I ).有 
放回地抽取大小为的随机样本.試証其中恰有々个紅的的槪率为 

⑴ pV -、 (11-1) 

2 . 了个寧尽，孕乎孛亭.如果"充分大，而且 » i /» = p , 則由 
(6.1) 和 V . n . D 很近似.更精确地說有 

om 宇 r < v (> v - u r . ⑴. 2 ) 

把它和前一个問題比較，則 表明： 对大的总体来說，有放回的抽样和无 
放回的抽样在实际上幷无什么区別. 

3. 从一个拥有》个元素的总体中无放回地抽取一个大小为『的随机样 
本.某指定的 N 个元素全部被抽中的槪率〜为 

Ur ~{r— iv)"="(r )* (U-3) 

(对有放回的抽样来說，其对应的公式由 （ mC ) 所 給出， 它不可能由此直接 
推出. （11.3) 的另外一种形式，請参看第四章問題9 .) 

4. 卑孕申萃.如果》—>00和 r —滿足 r / n ―>^，則《,— > p N 
(参看問 13).' 

注意： 問題5—問題13与著名的占位問題有联系(馬克司威尔-波茨曼 
統 計)： 也就是說，，个球分 布在” 个盒中，这种可能中每一种可能的槪 
率都是 t - rl \ 

~ 1) 問題 5—19 在量子統計中，在摄影感光版的理論中，在 G - M 計数器等等中都有 
应用.因此，在物理学文献中这凿公式那是経常討論經常出現的，通常是沒有 
把它們的重要的和本貭的初等性貭加以抽象.几乎所有的在这章开始时所弓 I 
进的間題在惠瓦茨 (Whitworth) 的书中都碰得到(虽然形式稍有不同）. 
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5 .某一个指定的盒中恰有々个球的槪率&由二項分布 （4.5) 所給出. 
最大可能的整数 V 滿足 ( r-n + 1)/«< V <(, + !)/«. (換句話說,它說明 
PO<Pl < … < Pv - l < Pi >> fV + l > …> Pr ; 参看問題 15.) 

6 •卑喂哮翠.如果"一>00和 >• ―>00使得每个盒中球的平均数 
数，則 


PK 


ff-U* 

~Ti~' 


(11.4) 


这就是普阿松分布，它将在第四章中討論;参看問題 16. 

7 •令»)为》个盒中沒有一个是空的可能分布的个数.用組合分析 
的推理証明 


幷推出 


^( r , n + 


1) = 名 Oo -々，《)， 


(11.5) 


A ( r -> n ) = 2( — l ) l, (^)(» — v ):. (11-6) 

0 

提示： 应用归納法;痕定 （11.6〕 威立,幷且以此表示 (11.5) 中的-々, 
»). 交換求和的次序，幷用二項公式去表 A ( r , » + 1) 为二个单重和的 
差.代第二个和中的 V + 1以一个新的求和指标幷应用 （8.6). 

注意： 公式 （ 11 .6) 是一个古典問題的理論上的結果,用它来直接計箅槪 
率是不方便的，例如，某一乡村有1900个居民，用这个公式来算一年中每一 
天都有这1900个居民的生日的槪率 r 就很麻煩.在第四章第2节中，我們 
将用另一种办法推出公式 （11. 6)，幷且得到一个簡单的近似公式（对上面的 
例子来說， r 近似地为 D . 135)_ 

8 •証明恰有 "•个 盒是空的可能分布的种数为 


E m ( r , n ) = (二)岭 ， n — m ) = (二 ) 琴 '(-1 ) u (" :爪)0 - m — V )、 

(11.7) 

9 .不用上面的結果来直接証明恰有 ”> 个盒是空的槪率 p m { r , n ) = 
r >~ rE mi . r , ”) 滿足 


Pm{r 十 1， 》) = p „( r , n ) ■ 


+ Pm ^ { r , n )- 


(H-8) 


10 .应用問題 7 和 8 的結果，用直接計算的方法来証明 （11.8) 成立.証 
明这种方法可以給出 （11.6) —个新的推导(对，作归納法）. 

11 •从 （11.6) 和問題 S 推出；大于等于《个盒是空的槪率为 





〆 {frj \ v /\ n / m V 

(当吋，这个式子为 0, 这是意料中韵事情 .） 

12.N 个指定的盒中，每一个都被占有的槪率为 

r 

«o, ”）=»” 2 ( 0 N )( n - N y~ k . 

*=o x ^ / 

由 此断言 

+，")=茗(-1)0-钉. 

(应用二項定理.对 W=« 我們有 《(r， n )= n -MO,》) .注意： （11.11) 
类似于有放回的抽样 1》 的公式 （11.3). 另一个推导参看第四章問題8 .) 

I 3 •年喂 f 吞 .. 如果換作問題 4 中的板限描述，我們有《0, ”） — > 

( 1 -厂 —. 

注意： 在問題 14— 19中， r 和《的意义与以前一样，但是我們假定球 
是不可辨別的，而且全部可辨別的排列都是等槪的(波司-爱因斯坦統計). 

14 •某一个指定的盒中恰有々个球的槪率为 

料 = m ( n + :- 1 ).( ㈣ ) 

15.証 明：当 》>2时，任何一个确定的盒中球的个数的最大可能的値 
为0 ,或者更精确地說， ^o>gi >- (参看問題5 ). 

令"一 > oo 和 r > 00 使得每一个盒中平均的貭点 
个数 ' 趋 ¥ ( 于是 

权一 CTTXyFT - (11 - 13) 

(右边了解为几何分布 .） 

17 •恰有《个盒是空的的槪率为 

1) 注意：《0，《)可以解释为当第] V 个元素加入样本时所需之等待时間小予 r 的 
槪率.其結果可以应用到随机抽取数宇中去：其中 «( r ,10) - 1,10) 为 

长为^的序列中包含了由全部10个数字所构成的全集的概率.这个可以用来 
作随机检驗.格林伍德 〔 Greenwood ) (参看 [19]) 把这些分布列成一个表，并把 
它与一些眞实的計算进行比較，这些計算是对应于的前2035位小数和 r 的 
前2486位小数的等待时間.全部10个数字构成的全集的等待时間的中位数是 
27. 这个等待时間超过50的概率大于《.05,而等待时間超过75的慨率大約为 
0.0037, 


(11.9) 

( 11 . 10 ) 

( 11 - 11 ) 
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18 _ 某指定的®个盒中的球的总数恰为々的槪率为 

i 9. mm ^：. 如果換作問題 4 中的极限描述，我們有 

( - + /- 1 ) _ (11.16) 
' \ m — 1 /(I 十 p ) m+ ! 

(右边是在第六章中引进的負二項分布的特殊情形 .） 

关于連貫的定理.在問題 20—25 中，我們考虑由 n 个《和 r 2 个/3所构 
成之排列，而且假定所有排列都是等可能的[参看例 (4. d )]. 这一組問題与第 
^节有联系. 

20 .在棑列中恰有々个連貫(不分种类)的槪率当 k = lv 是偶数时为 

〜= 2 (m )+0 _ 

当々= 2 v + 1为奇数时，其槪率为 

〜: XG 1 ) + 1 1 ：：% 2 T 1 PC 1 T 2 ). ( u - 18 ) 

21( 辍上）.推出連貫的个数的最大可能数値为滿足 

< k < - nr2 - +3 
r \ 十 r \ + r 2 

的整数（提 示： 考虑比 P 2 v + 2 J rP 2 v m P 2 v + l - i - P 2 v . l .) 

22 .排列中以一个长为 V >0 的《-連貫开始的槪率为 ( r,)^2 ^ ( r ! + 
r 2 ) v+u (提 示： 选取 V 个 a 和跟随其后的卩 .） 当 v = 0 时，定理蘊含了什么 
呢？ 

23 .恰有々个 a - 連貫的槪率为 

-^G'r/X'D-^rr 2 )- (⑽) 

提示：这可以由第5节的引理的第二部分直接推出.另外，方程 （11.19) 
可以由 （11.17) 和 （11.18) 推出，不过手績比較繁难， 

24 .第》个 a 恰在》«个 P 之前的槪率为 

(〜一，.:上:一 md (⑽) 

25.全部 a 分居于々个連貫中，其中有心个长度为 I ,心个长度为 
2，…， kv 个长度为 v(^i +々 2 +…+ k v — k ) 的槪率为 

-■ / ! ^ ( rz + 1 )-( n 4 - % (11.21) 
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12. 二項式系数的一些問題和恆等式 

1. 对于整数来說有 

… 0 ⑴-十…， 

(:)+七）+心）+…一丄， … 

( 12 - 1 ) 

( 0 _ 2 ( 2 ) + K 3 ) _ +… = 0 ， 

2-1(2) + 3:2(3 ) + 4-3(:) + …= »(« - 1)2”_ 2 . 

(提 示： 应用二項公式 .） " 

2. 証明：对于正整数”和々，我們有 

( = ) ⑴ -(:)(; 二 ;) + (m d … 土 ⑺ ( n r) =。- ( 12 . 2 ) 

更一般地\我們有 

2(:)G：：X:)( …)、 ⑽) 

3•对于任何的«>0,都有 

(了)=(- Dd 1 ). (i2 - 4) 

如果《是一个整数,这个方程可以由对几何級数 (1- ^)- 1 进行微商 
来証明. 

4. 証明 

(2:) 2 - 2fl= (—…(:”. (12.5) 

5. 对于非負整数》和 r 和一切实数“来說，都有 

i 0 C 7 v )= e :：)- c ； i )- ⑽) 

(提 示： 应用方程 （8.5). n = a 的特別情形是經常用到的 .） 

6. 对于任意《和整数 »>0 来說，都有 

2^- 1 ^( v ) = (_1)B C « ')• (12 . 7) 

v = 0 

(提 示： 应用方程 （ S .5).) 

1) 讀者回忆一下 ( S .5) 的約定;如果 V 跑遍全部整数,則 （12.3) 中的和中只有有限 
多項非0 . 
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? •对于 _ fE 整数〃和々来說，有 

( a ) 用 （8.6) 証明这个等式. （ b ) 証明 （12.8) 是 （12.7) 的特殊情肜. （ c ) 用归 
納法証明 （12.8) 給出第5节的引理的第一部分的一个新的証明. 

8•在第6节中曾指出超几何分布諸項之和为1 . 这說明对任何正整数 
«，^，》来說都有 

⑴⑴七 （0 (丄） + ... 十（：)⑴ 0.9) 


用归納法証明之.（提 示： 首先証明 （12.9) 对 fl = 1和全部6都成立 .） 
9( 續上）.用比較方程 


(1 + t) a {l + 0 * = (1 + O a+b ( 12 . 10 ) 

两边0的系数的办法来更一般地 証明： （12.9) 对任意 a ， (及任意整数 》) 
都成立. 

10- 应用方程 （12.9) 証明 

⑺ Ml )、 ⑴、… +(:) 2 = ( 2 :). ( I 2 .⑴ 


U . 应闬方程 （12.10) 証明 

今 ( 2 ")! = / 2»\ 2 

含 ( 、 0 2 ("-V)!2 ~\nj 

12•証 明： 对于整数 0< Kb 有 


( 12 . 12 ) 


i (- i ^ axu ?)= c -.)- ㈣ ) 

為》1 

(提示〗应用 （ i 2 . m ) 証明 （ mi ) 是 （ I 2 .?) 的特別情形.此外，再比較 
([_/)»(! _ t yi -2 = (! _ t ) a - b -2 两边 的系数 .） 

13.从 （12.9) 用特殊方法推出恆等式 


⑴-(二>-…；( X 1 )(叫 

和 

2 (-o^U)(" 7 v ) = C-：) ⑴川 

V 


对正整数4，《 和^ •都成立.[提 示： 应用（1 2 .14).] 
H . 应用方程 （12.9) 証明 



m = m . (12 _ 16) 
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(提 示： 应用方程 02 . 4) 的后部和前部 .） 注意& = 1, 2的重要的特殊情开乂 
15•和第〗]节中的問題联系起来，注 意： 方程 (11.12),(11.14),(11.15) 
和 （ U .16) 都定义槪率.因此，在毎一个方程中諸量之和为1 . 証明： 达些 
关系分別地被 （12 .8)， （12. 9)， （12.16) 和二項定理所蘊含. 

16 .从第11节問題7中关于 A ( r , «) 的定义出发，可以 推出： 如果 
r < n , 則 A { r , n ) — 0,而且 A { n , n ) ~ n \. 換句話說 


2 (-v = 

*-0 ^ n \ 


如果 r < n , 
如果 r ~ a . 


(12.17) 


⑷用化 "为 » - 1的办法直接証明 （12.17). ( b ) 其次用考虑 （1 - 〆 )”在 
r = 0 的 r 次微商的方法来証明 （12.17). ( c ) 从出发而不从 （11-6) 


出发来推广 （12.17). 

17.如果用归納法証明：对每个整数 r > Q , 都有 

2( — l) v O — C 二 (12.18) 

w »=0 、 1 

(注 意：当 和 r>n 时，右边为0 .) 用考虑 " (t ~ 1)" 在/ = X 的 
微商的办法驗証 （12.18). 

18 •用归納法証明（应用二項定理） 



)+-( 2 "心 


••• + 


(_1) n _1 C)T = 


1 + T + T + 




(12.19) 


用积分恒等式 2(1 -0 P = {1 - (1 - 0"> -1 的办法来驗証 （12.19), 
0 

19 .証明对任何正整数都有 


(尤 + y + z ) m — 27 

其中求和号是对全部滿足 a + b + c = 

20.应用史特令公式証明 


為咏 (12 ' 20) 

饥 的非負整数 a , &，仁 来求和的. 


( 2 :)~(心)-" 2 2 2 ' 

21. 証明对任何芷整数 △ 都有 

(fl 十 1 )(« 十 2) …（“十 ff ) _>! n a-b 
(b 4 - 1)0 + 2 ) … （办 + «) 叫 • 

22 . r- 函数的定义如下： 


( 12 - 21 ) 


( 12 . 22 ) 
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r { x ) — z x ~^ e - K dx y 

其中 Y >0 •証明 r (0 — ^ r )" 2 e - V -( i /2). (注 意： 如果 f 
数，則 r ( w ) = (« — 1)!.) 

23. 令和 /* 是任意正数，而《是一个正整数.証明 

a (a 十 r)(3 十 2r ) … （0 十 》 r)~O n+1 « n+ ( a / r 1 +1 / 2 e _ *\ 

[常数 C 等于（2叶/2久(《々）.] 

24. 应用前面一个問題的結果，証明 

a ( a -f 0 ( fl + 2r)-"(a + nr) _ r{bjr) n{9 - b y T 
办（占 + r )( 办 + 2r)"* {b -|- nr) I\afr 、 • 

• 25 .証明下述史特令公式的另一 形式： 

— ( 27r )V2(„ 十 l_y +1J2 e -(^i/2y m 


应用課文里面的方法，証明 

+1/2 


26( 續上） 

(2^)^ 2 (« + i -)" 

<(2 汗)吟 + +) 

27.推广史特令公式，証明 

n T . 〜 ( 2 ^*)l/ 2 n n+ l/ 2 eX p{ — n + 


，.- (»+ l / Z )- l /24 C »+ l /2') <„| < 


n+1/2 


-( n +1/2) 


\2n 


360r. 


+ 


(12.23) 
« 是一个整 

(12.24) 

(12.25) 

(12.26) 

(12.27) 

(12.28) 
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# 第三章 > 扔錢币的起伏問題和随机徘徊 


本章目的有二.第一，通过它，将要說明极簡单的方法可以导 
出深刻而又重要的結果.第二，在这一章中，我捫将要第一次碰到 
一些理論上的結論，它不仅是我們所想象不到的，而且实在給直覌 
和常識一个大大的振惊.它彳門将会說明，一般人所接受的关于随 
机起伏的槪念是沒有根据的，而且关于大数定律的含意在很大程 
度上被 誤解' 

这里所以插人这样的討論只因它有初等的性貭，本书的主要 
論題在第五章再接續.全书都不依賴这一章.这一章里某些公式 
在后面討論初过和再現时将会重新出現，不过卞們还要用分析方 
法重新推出.方法的比較将是富有教益的而且是有趣的.因此， 
讀者可按自己的判断閱讀本章或者与本书其余各章同时幷进地閱 
讀，或者单独地閱讀.为了对上述办法給以便利，这章书可以分两 
次 閱讀： 主要的标題用通常的形式印出.用小字排印的地方包含 
一些附加的內容(主要是与初过和再現現象有联系），因而初讀时 
可以略去.第7节包含一个經驗的解释. 

1•一 般討論 

关于一般的随机起伏的相当丰富內容可以由下述的伯川 
( Bertrand ) 在1887年所发表的一个不显著的引理所推出，类似的 


1) 这一章可以略去，或者和下面几章猪合起来讀.在第十章(大数定律)，第十一章 
(初过时間），第十二章(再現事件)，第十四章(随机徘徊）中都将要参考本章的內 
容.不过，后面沒有明显地用到这些內容. 

2) 虽然形式上我們 R 考虑扔錢币，伹是其基本結論是有广泛的应用的.事实上，安 
德生 (E. Spar re Andersen ) 的惊人发現 ： 独立随机变景和的起伏理論的浪多方 
而都具有純粹組合的性貭，而且这样的随机变量中有很大一族都具有共同的性 
貭.特別言之两个氐正弦律就是如此，参看 [ 1 2 0 J . 
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排列問題，在以选举問題命名的組合 分析里 曾吸引过学生們的兴 
趣 1 \假定一次选举中，候选人 P 获得 f 张选票，候选人0 获得？ 
张选票，其中 P>q. 在数票过程中 經常是 P 昕获之票比 P 所获 
之票多的槪率为 （P — ?)/(? + q). 

用数学的語言来說，达里我們所考虑的是由 X=p+q 个符 
-§■ g 1? e 2 , • • • , e , 所构成的一些排列， • • • , 中有 P 个正1 
(f 的选票 ） 9个負1 (£> 的选票）.部分和 u = ei+s 2 4 - - - - +s* 
是在第4票刚投了以后，候选人 P 所領先或落后的票数，显然 
fx = p — q , 而且 

— Si-i = Si = ±1, y 0 = 0 , (t = 1 , 2, - , x). (1.1) 

反过来，滿足条件 （ LI ) 的每一个整数的排列 {〜• • •，& } 都表示 
一个可能的投票記录.我們将要采用几的語言，用一条其第 *_ 
边之斜率为 e , 第个頂点 之枞坐 标为&的折綫来表示这样一个 
排列.这种折綫我們叫作路径. 

定义.設：《： > 0和 y 都是整数.从原点到点 U , y ) 的路径 
{，1，巧，•-•，^ ：} 就是一条折綫，其頂点的橫坐标为0, 1，2,…，，其 
頂点的纵坐标 r 。， s u ■ • ■ , s x 滿足 （1.1) ,而且& = y . 

如果 s,. 中有 P 个正的<?个負的，則 

x = p q, y = p — q, ( 1 . 2 ) 

如果能用一条路径把 O, y) 与原点联結起来，那么 q y 必是形如 
(1.2) 的数.这时， bKx^p + q 个可能位置中选取 P 个正 s,. 的 
位® 的不闻选法共有 

个.为了方便起見，当*, y 不是形如 （1.2) 的数时，我們定义 
A^, y = 0. 于是，联接原点和 O, y) 的路径共有 A^, y 条.伯川的选 
举問題的定理断言：当 y > 0时，滿足条件^>0,, 3 >0, •••, 
^-1 >0, ^ = y 的路径共有 iy / xH 此定理将在第2节中 


0关于这个間題的历史和文献参看 [ 2 1], [22 J , 
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証明. 

例.图1描出了一条到化=(5，1)的路径.这样的路径共 
有10条，其中恰有两条滿足 5,. > 0. 迖两条路径中的一条就是图 
1所描繪的{1，2, 1, 2, 1}，而另一条就是{1，2, 3, 2, 1}. 



如果我們取消路径的終点 U , y ) 事先固定的这个約定，那么 
便可以从选举問題的定理推出很多有兴趣的結論.从原点到 （《, y ) 
(紈坐标 y 任意）的路径共有 2" 条.如第3节所解释的，这 
路径可以解释为連續扔一个均勻的錢币》次所得到的2»个可能 
的結果.經典的描述是引进一个假想的賭徒甲，他在每一次試驗 
时或者贏一元，或者輸一元.因此，序列 {〜 巧，•…， U 代表甲的 
接連的累积贏利，也就是正面起过反面的累积次数. 

如果〜= 0,卽是第《次試驗刚作完后其臝利为0,卽是一 
次和局.和局的出現是非常少見的，以至于它們不会影响图形，但 
是，重复地提到它是很麻烦的.因此，我們約定当〜 >0时，或者 
当〜= 0且> 0时（卽是当和局出現时，誰在前一次試驗領 
先，誰就被孰为是領先），称甲領先.“甲在第》次試驗領先”与“第 
« 边在* 軸上方”的意义是一样的. 

选票問題是考虑一些完全处于 X 軸上方的路径，卽是，考虑这 
样一个賭博問題，其領先权是永不变的.这个論題的进一步的硏 
究是硏究任何一条路径的領先权改变的頻繁程度.与此联系，我 
們得到了一些与直观相差很远的結論.一般都这 样想： 在一长串 
扔錢币的序列中，甲，乙領先之次数各半.然而，这是完全錯誤的. 
在20,000次抛擲中，某甲在20,000次中一直領先的可能性比甲乙 
备領先10,000次的可能性約大88倚.一般地說，領先权改变得 
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如此不頻繁致使它是对直观想象的一个拢战.不管抛擲的序列有 
多长，領先杈改变的次数的最大可能的数値是0;領先权恰巧改变 
一次的可能比改变两次的可能大，改变两次的可能比改变三次的 
可能大，等等.簡而言之，如果一个現代的教育家或者心理学家去 
描写个別的扔錢币的賭博中长久的历史，他一定会把絕大多数錢 
币視为不均勻的不完整的.如果把很多錢币每个扔》次，它們之 
中有非常惊人大的一部分使領先权几乎在全部时間中都落在某一 
个賭徒手中;而有很少一部分使領先权換边，幷且它的起伏变化正 
象人們对标准錢币一般所期望的那样. 

这是由第一反正弦律（参看第5节和第7节的解释）所导出来 
的一个結論.安德生曾經 指出： 这个定律的应用范围是很广泛 
的，这里所描述的关于扔錢币的情形是累积效应的随机起伏的典 
型問題.物理学中,+經济学中，教育学中很多随机过程都是这类性 
貭的，而且我們的发現对那些执恋于分辨通常趋势和偏离平均的 
入来說是一个忠吿. 

可以从各种不同的角度来考虑同样的情形.如果用一致的速度扔錢币， 
一般的想象总是 这样： 适当的承訊随机起伏，作两天試驗所出現的和局的次 
数应为作一天試驗所出現的和局的次数的二倍.換句話說，直覌上,我們期 
望和局的次数与試驗的持纘时間成比例地增加 . 事实上幷不如此，和局的次 
数大致上与試驗的持續时間的平方根成比例地增加.在10,000次抛擲中， 
和局次数的中位数为67,但是，在1,000,000次拋擲中，和局次数的中位数 
增为674;典型“波长”約从150增为 1500. 平均“波长”随吋間之增加而增 
加（第6节和第8节）.作为这些結論的基础的公式在一般的随机徘徊和扩 
散理論中的初过时間和再現时間中起着很重要的作用， 

第2节定理3和其余的內容沒有联系,而且在其它的地方也用不着.它 
是两个候选人都获得同样多的票数(譬如說》)的选举問題的变化問題.这时 
候选人甲領先 M 次，而乙在其余的 2 » _ 2々次領先.这里，我們又会产生錯 
覚，以为毎个候选人領先的次数大約各为一半，卽是，我們期望2々与》很靠 
近.其实不然，如果选举的結果是和局»：»,則領先权的1种可能分配 
(为2«：0, 2 n - 2：2, 2 n — 4：4, •••, 2：2 n — 2, 0：2»)都具有同样的槪率 
(» + I )' 1 . 这个結果与前面所描述的那种对最后結果不事前給定的情形形 
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成一个強烈的对比;在那里最极端的分配 2n ： 0ti0 ： 2n 都是最大茚能的. 

郝捷士 0. L . Hodges ) 曾經指出阳 】 ：这些定理在“ 行序” 检驗中有統計 
应用.我們用下面的例子来解释这点. 

例. 假定对《个精心培植的东西的毎一个都測得一个量，同吋也对另 
外》个被控制的东西的每一个都測得一个量(例如植物的高)，从而得到数据 
fll ，…，，和幻为了确定起見，假定每一組都是按下降的次序排 
列的：…和 &>&>••.. fi 我們把这两个序列結合在一起，幷把这 
2 n 个字母^，…，~按下降的次序写出.》个《和》个6排列的結果可以 
解释为一个选举問題，其中每一个候选人都得到》张选票.一种非常成功的 
处理是厨有的 a 都在 i ■的 前面;一种完全无效的处理是它們构成一个随机的 
次序.在我們的排列中，如果在有々个不同的》在其相应的 * 的前面，卽是 
如果不等式>么•对4个指标成立，則 說“ 恰巧領先2々次.如果假定随机 
性，則这件事情发生的槪率为 1/(" + 1)，因此， a 領先2々或者多于2々次的 
槪率为 (》 —々+ 1)/(» + 1). 关于这 个討論的典范（沒 有槪 率論知識只是 
定性的）是由格尔頓 ( Gallon ) 所給 出的， 他在1876年用之于却尔斯.达文 
(Charles Danvin ) 給他的資料上.在他的 例子中 2 ” 是 M 且 a 領先 26 次.格 
尔頓断言，这种处理仍 然是有 效的, 但是在只有随机性的 假定下，甚至一种无 
效 的处理 ，在16次类似的試驗中有三次可能会产生領先次数超过 26 .这就 
說明： 定性的分析对我們的 不可靠 的直观来說,仍然是一神有价値的补充. 
(至于一些有关的检驗，是基于連貫理論上的.参看第二章 5 a .) 


2.排列問題 


令 A = (^a, ct ) 和 B = (_b, )3) 为正象限內的整点： b > a ^ 0, 
a > 0,/9 > 0. 点/关于 y 軸的反射点就是点 J' = 0 ，一 a) (参看 
图 2). 从 J 到 B 的路径的定义仍如 §1, 不过这里/点相应于那里 



图 2 .反射原理的示 意图, 
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的原点. 

引理 n (反射原理).从4到 B 的路径屮触到或者穿过 x 蚰的 
路径的个数等于从/到 S 的路径的个数. 

証.考虑一个从3到5且在; c 軸上有一个或一个以上的頂 
点的路径 {& = a ， 〜 +1 ， • • •，& = jB }. 令， 为第一 个这样的頂点 
的橫坐标（参看图 2); 也就 是說： 选取？，使得〜>()，••-, ^_!>0, 
，《 = 0. 因此，{—■!■„， —S a +\, . . • ， — ^-1, ^ = 0, X,+l, S t +2, •••，《•«■} 
是引导/到 S 的路径，而且 r = 0) 是它在 X 軸上的第一个 

頂点.析綫和 A ' T 互为反射，从而全部从 j 到 B 的有一頂点 
在 x 軸上的路径与全部从/到 S 的路径之間存在一个一一对应. 
这就証明了我們的引理. 

定理1 (选举定理).令* > 0, y >0 i 从原点到<>, y ) 使 
> 0, s - 2 > 0, > 0的路径{&， h ，• • • , s x = y } 的总数为 

( y / x ) N x , y . 

証.因为^!=±1,所以对于每一个合乎定理要求的路径都 
有 h == 1. 这就 推出： 合乎定理要求的路径的数目与从 (1,1) 到 
(. x , y ) 的而且旣不触到 x 軸也不通过*軸的路径数相等.由上面 
的引理得知，这样的路径的数目为 


N x -l,y-l — N, 


x-lj y-hl 


乂 p 


又 1 )- d 


p — p + ^ j 




( 2 . 1 ) 


对偶原理.几乎每个关于路径的定理都可以改变陈述而得到形式 _ h 不 
同的定理，考虑 （〜 …， V )和由它 顚倒々 的次序而得到的路径 (; f ， 彳，…， 
4}，其中 

-f* = s xy s* = ： e x -e x _i, 4 =； A + e x _i -f- e x , 2y — 


1) 在概率女献中狀为此方法是由安德 ( D . AndrO 所給.本书把它化为随机徘徊 
的一个引理.古典的随 机徘徊 (第十四章）的差分方裎与微分方程非常类似，而 
反射原理(甚至它的更強的形式)在微分方程中热知为凱尔文 （ Kelvin ) 助爵的 
映象方法. V 
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或者 


.<* = o, sf = s, — /,_ 1 , sf = J x — s x ^i, ■■■, s% — s x . (2.2) 
路径（】.】）和（2.2)是重合的，而且它們之中的任 一个可 由另一个旋轉180° 
而得到；它們所联結的頂点是相同的.对于路径的每一个定理，都可以对应 
着一个把它应用到倒路径 （2.2) 去而得的对偶定理. 

例如，逸举定理給出了从原点到卜，: V )而且彳 >0(*= 1，2,，…， •》) 的倒 
路径 Of ， … ，4) 的数目.这个数目与滿足〜 (/= 1，2,…， * 一 1) 
的数目相等，因而 ，我 們得到了选举定理 的另一 形式： 

定理 1*, 从 （0,0) 到(欠， y ) 的滿足 ■ q <&， …，〜-1<& ( 其中 
& = y >0) 的路径数等于 （ y /*) 仏 , y . 

如果用几何的語言来說，定理1中所考虑的路径是左端点为最低頂点的 
路径，而定理 1* 所考虑的路径是右端点为最高的頂点的路径(参看图5 ) .定 
m 1* 与随机徘徊的初过时間有联系. 



現在我們再冋过来討論联結原点和 X 軸上的点 AT = (2 n , 0) 
的路径(在 r 軸上的端点数不可能是奇数）.令 



走理 2 . 在联結原点和％軸上的点的条路径中 

( p ) 恰有 Un-2 条路径滿足 

0 y s 2 > 0, . • ，， > 0 {s 2ft = 0) ? (2.4) 

( b ) 恰有条路径滿足 
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0, f 2 ^ 0, … ， f 2 „-i ^5 0 (s 2n == 0 ). ( 2 . 5 ) 

(这就是說，由原点到 2« 的全部內頂点都在 f 軸以上的路径数与 
由原点到 2n — 2 的沒有頂点在 r 軸以下的路径数相等 .） 

証（参看图1_). 每一条滿足条件 (2.4) 的路径都通过点 

(2«-1, 1)，因此，由定理1得知，到点 M 且滿足 n >0, • • 

的路径数为 



( 2 .&) 


这就証明了 （ a ). 再令一条路径滿足条件( 2 . 4 ).截去其最初和最 
后一边，我們就得到了一条联結 O x = (1, 1) 和从= {2 n - 1, 1) 
的而且其全部頂点或則在直綫 y 1的上方或則落在 y = 1上 
的路径.把原点移至《^后，我們就得到了一条联結新的原 点和恥 
(它的两个新坐标是2» — 2和 0) 的路径.它沒有一个頂点在新 
的尤軸下面.因此，我們在这样的路径与滿足条件 (2.4) 的路径之 
間建立了一个一一对应，这就証明了我們的定理. 


如第 . 1节所說明的，下面的定理与其余的无联系，而且以后也用不着. 

定理 3 【 川.令 L 2k , 2a 为从原点到 X 軸上的点 2 »的恰有 2 々粂边在 * 
軸上面而有2« — 2 彳 条边在^軸下面的路径的数目0, I ,-", »). 于是 
^2*.2» = L 2 „ (不依賴々） . 

®E. 当 n == 1时，結論显然成立.我們用归納法証.假定 L 2kt2v = i-Zu 
对 V = 1，2,…，》 — 1; 成立. 我們想要数出{”， i 2 }-"^ 2 n = 0} 

这狴路径中恰有邛 个 边在*軸上方的路径 个数. 首先我們假定 1 矣& 1 . 
这样的路径經过 r 軸，我們令此路径在*軸 上的第 一个頂点的横坐标为 
然后考虑二族路径. 

第一族中的每一条路径在到 > 之間是芷的，而且它在 > 到 2 ” 之間 
那一段路径恰有 2 k — lr 条边在*軸之上方.其中々>，•由定理 2 ( a ) 得知， 
路径 Gl ， U ， …， s Zr-\ , Sir = 0) 中滿足 ^1>0, S 2 r-l > 0的共有丄条， 
而且，由归納法假設得知，联結(2〜 0) 和（2«, 0) 的同时恰有 M — >条边在 
* 軸上方的路径数为 L 2k . 2ri2tt . 2 r = ^„-2 r . 因此，这一族共有 ^2r-2 ^ln-2r 
粂路径. 

第二族中的毎一条路径在0与及之間都是負的;它在 2 / ■与扣之間那 
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一段恰有 2々 条边在 x 軸的上方.由上面的推理得知，这样的路径个数仍然 
是 L 2r-Z L Zn -2 r ， 不过这时》— 

由此推出，对于々=1 ，…，” 一 1 ，我們有 

k 

^*2^,2 n ^ 2 r — 2 ^- 2 n - 2 r + ^ 2 r — 2 ^ 2 a — 2 r 9 (2.7) 

尸_1 r«l 

变換求和号中的 附标： p=»-r + 1,上面的第二个和的項变为 L 2t ^ 2 
^2 n -2 r = L 2 p _ 2 L 2 n _ 2 p 此时 P 由々+ 1跑到”.因此 

n 

^- J 2k.»2n ~~ ^2fi~2^2n~2py - 8 ) 

<3-1 

它不依犋々. 

全部2»个边都在 * 軸上方的路径正是定理 2( b ) 中所考虑的那种类型 
的路径，因此 L 2a , 2 „ = L 2 „. 由于对称性，我們也有 L 0 , 2 „ = L 2 „, 又因由原 
点到 （2 n , 0) 的路的总数为 （》+ l ) L 2 „ ，故有 L 2k , 2n = L 2 „ 3 ft k = 0 ,\, — , n . 
作为一个系,我們有 

n 

乙 2 n 二 ^ Zp ~ 2 ^ 2 n - 2 p % (2.9) 

p = l 

此式的直接的分析証明請参看 8(a). 

3. 随机徘徊和扔錢币 

在一个 zv 次扔錢币的序列中，如果第々次出現正面，則令 
e々 =1，否則令 e k = —1. 于是 Q = Si + s 2 + • • ‘ + 6七是" 
次抛擲后正面比反面多出現的次数.如果用賭博的語言来說，4 
是“某甲所获之純利接連 AA 次扔錢币中每一个可能的結果都可 
以用一条从原点幵始的具有 W 边的路径来表示，反过来，每一条这 
样的路径都可以代表 W 次扔錢币的一个結果. 

这种考虑使得我們可以把从原点出发的条路径 {〜••*,〜} 
作为我們的样本空間，而且每一条路径賦以槪率 2 ' 

“最初两次試驗出現正面”这一事件必須解释为全部这样的序 
列： 其中 h = 1，& = 2. 这样的序列共有 2 N _ 2 个，因此这一事 
件的槪率为 2' 更一般地，如果 k < N , 則恰有 2'^ 条不同的路 
径{&，&，•••， 〜} 其最初々个頂点落在給定的路径 U, …， 小上. 
这就 推出： 由最初 K < ZV) 次試驗所决定的事件的槪率不依顆于 
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N . 因此，在实际中，当#充分大时， / V 幷不起什么作用.从槪念 
上来看或者从形式上来看，最好是把一个抛擲的有限序列都考虑 
为一个非明显的无穷序列的前面一段，但是，这会要求我們考虑不 
可数的样本空問.因此，我們将只考虑长为 iv 的序列，其中 iV 比公 
式中所出現的試驗的次数要大；此外，我們将乐意地忘却 iv . 

为了加強槪率背景及其 与相关 問題的联系，我們希望用不同 
术語来补充几何語言.我們設想每隔一段固定的时間扔一次錢 
币，因此，第〃次試驗在时刻《进行.某甲可以用一个指示器（我 
們称 它为“ 貭点”)标記每一个时刻的累积的贏利.因此，这个貭点 
从原点开始在垂直綫上运动.它在时刻1，2, • ••运动，当錢币出 
現正面时它向上移一步，当錢币出現反面时，它向下移一步.我們 
說： 这个貭点作对称的随机徘徊.（物理学家把它作为一維扩散 
的最簡单的 模型; 参看第+四章 .） 

在时刻》，貭点的位置是垂直綫上的点〜路径{^，•••，〜} 
表示随机徘徊的空間——时間图解，*軸相当于时間軸. 

由这个直观背景的指引，我們引进下述术語. 

术語. 我們說在 时刻” 貭点回到原点，如果〜= 0. 說在时 
刻》貭点第一次回到原点，如果 

^1^0, s 2 ¥= 0, ••‘， ¥= 0, f„ = 0. (3.1) 

說在时刻》貭点初过 r > 0,如果 

巧 <r ， s 2 < r, …，< r, s„ = r. (3.2) 

至于第二次，第三次 ，• ••回到原点，初过 r <0 都可以仿照上面 
的办法定义.注意，只能在偶数时刻分子才能回到原点，而且我們 
将常常把公式限制在偶数时刻.用睹 t # 的語言来說，返回原点表 
示正面出現的累积次数与反面出現的累积次数相等.（图 3 列出 
二条路径,其中初过和返回原点都分別地 标出； 第二条路径具有每 
—边都是負的特性 .） 

4. 組合定理的修正 

在以后各节里，我們将要引用下列符号： 
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0, 1， 2,-- 

(4.1) 

和 



/u = 0, 

=1 3 2, • • •. 

(4.2) 

容易驗証 



“2»—2 5 打 

1， 2，...， 

(4.3) 

定理 1. 对于每一个都有 


U 2 n == P {^ 2 n = 0} ? 


(4.4) 

« 2 ” = P{sx ^ 0 ? 5 2 9^ 0, • 

• •， 巧 〆 0}， 

(4.5) 

«2« = P {^1 > 0, 5* 2 > 0 5 _ 

…， y 2w > 0}， 

(4.6) 


用話来說，下述三个事件的槪率都是 « 2 »：( a ) 在时刻2«貭点返回 
原点； （ b ) —直到时刻2«为止都沒有返回原点； （ c ) 在0到之間 
路径是非負的. 

此外 

fin = P{^i ^ 0, s 2 ^ 0,- , y 2 „_i ¥= 0, s 2n = 0}, (4.7) 

fin = P{^i ^ 0, ^ 0 , • • • , r 2 „_ 2 ^ 0, s 2n -i < 0}, (4.8) 

这就是說，下面两个事件的槪率都是 ( a ) 在时刻《第一次返回 
原点； （ b ) 在时刻 2 n — 1初过一 1. 

証.如第3节所討論的，只需考虑固定长度2»的路径所构 
成的样本空間.由 （1.3) 得知： 联結原点与（2«， 0) 的路径共有 

条，这就証明了 （4.4). 

由第2节定理 2( a )， 联結原点和(2», 0) 的且滿足 
x 2 „-i > 0路径的共有 L 2 „_ 2 条.因此，滿足条件 (4.7) 的路径的总 
数为上述总数的两倍，从而其槪率为 2 L 2n _ 2 • I - 2 - = Un. 用同样 
的办法，由第2节定理 2( b ) 可得 （4.8). 

一直到时刻 2' 为止，尙未返回原点的槪率等于1減去在小于 
等于 h 时刻上第一次返回原点的槪率.应用 （4.7), 这个差为 

1 一 f2 — U — • • • — fin = 

=1 — (1 — « 2 ) — («2 — W 4 ) — - ••— («^_2 — U 2n ) = 

=«2« 3 (4.9) 

• 79 • 



这就証明了 （4.5),.， 举似地， （4.6) 的右边等于1減去在时刻〜以 
前初过一 1的槪率，应用 (4.8), 这个差仍为 （4.9). 这就完成了我 
I '門的証明. 

系. 对《 > 1有 

» 

u 2 n ~ hr u 2 n — 2 rm (4.10) 

r = 1 

証.如果在时刻2«返回原点，則第一次返回原点一定在某 
个时刻 2 r < 2 n . 我們刚才看到，联結原点与 （2 n ，0) 的路径而且 
在 2 r <2«时第一次返回原点的条数为 2 ^ - 2 2 ”_、 2 „_ 2r .对 
汆和，我們得到方程 (4.10). (直接的分析証明参看8 ( a ). 在第 
+三章第3节中，我們将要 看到： （4.10) 是再現事件的基本方程 
的特別情形 .） 

第2节中的定理 1* 算出了在时刻 r 初过 y 的路径数. * + y 必須是偶 
数,为了方便起見，令^ = 2* - r , 于是定理 1* 的內容可以表述 如下： 

定理 2. 在吋刻2«—： v 初过 y >0 的槪率为 

= zr-^ — { 2n ~ y ) 2 _2n+y , «> y > 0 . (4-11) 

2 n n / 

用对偶原理彳巴上述的重要公式作为选举定理的直接推論而推出，这种簡 
单的方法是値得注意的.公式 (4. 11 ) 的直接的分 ff 推导是困难的，它需要一 
些特別的技巧. 

原則上，槪率/汶可以对 y 用归納法来算出.一粂长度为 2 n _ y _ 1的 
在終点初过 y + 1的路径可以分割为二段(参看图3, y = 4). 第一段是由 
原点到初过 y 那一点所构成的路径;初过 J 发生在某一个时刻 2 v - y < 2 »- 
y -1. 継第一段之后是第二段，第二段是一条长为2» - 2 V - 1的、其終点 
是唯一的一个在左端点之上的頂点的路径.換句話說，如果其左端点是原点， 
則第二段是一条在終点初过】的路径.由定义 得知： 第一种类型的可能路 
径共有 2 ^-y f 2 V %, 第二神类型的可能路径共有2 2 -- 21 - 1 沿条，而且 
任何两条都可以联結成一粂在时刻 2 n - y -\ 初过 y + I 的路径.因此 

1 jn +l> = 2 & 您 -2” n >y + 1. 0-12) 

v^y 

公式 (4.8) 說明： 在时刻 2» — 1初过一 1 ( 因此初过+ 1也一样)的槪 
率为/2«,这就是說 
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i ^= hn , n > l . (4.13) 

公式 (4.12) 和 (4.13) 递推地决定了全部/汉，但是不容易驗 SE (4.11) 滿足 
( 4 .12)，因此， （4.11) 这个明显公式如何由 （4.12) 推出是不显然的. 

由公式(4_12)和 （4.13) 可以导出一个新奇的結論.由 （4.13) 我們看出 
/设是在时刻2” 初返原点的槪率.赴我們忘掉上面的定理，我們定义/汶为 
在时刻第）’次返回原点的槪率.不加改变地应用上述証明中所进行的推 
导： 把一条由原点到第 (y + 1) 次返回原点的路径分为二段，前一段为原点 
到第 y 次返囬原点，后一段为其余的，我們将再一次地看出 U . 12) 成立.因 
为达个关系唯一地决定了全部的所以我們有 ' 

定理 3. 在时刻2»第7次返回原点的槪率由 (4.11) 所給出. 

考虑一条由原点到时刻 2 »_ y 初过 y 的路径.（图 
3显杂+ V = 5," 2n-y= IS 的情形 .） 造一条新的路径 如下： 把原来的 
路径再插入 y 个新的边，每一条新边的斜率都是 一1, 这}条边的左端点分別 
为原点和 y — 1个这样的頂点，在它們上面分刖初过 I 2,…， y - l . 这条 
新的路径我們以{>， ff 2 , …， 表之，它的长度为 2«. 显然 ， -, r 
O2 „_ i < 0 , a 2n = o , 而且 恰恰有 y — l 个內頂点落在 z 軸上.反之，每一条 
具有这样性貭的路径，可以从在 2»- y 时刻初过 > 的路径用上述方法求得. 
令/设为定理2中所定义的槪率（卽在 2n-y 时刻上初过 y 的槪率），我們 
看到具有下述性貭的路径： { ffi , a 2 „}, KO , d 2 „ = o 且恰有 y - 1 个 
內頂点在 r 軸上，共有/拉条.这样一粂路径是由 y 段所构成，其端 
点在 r 軸上，因此，当我們变換达种路径的一段或几段中所有内的符号的时 
候,我們可以得到以条不同的路径.用这种办法,我們得到了全部长为 
的滿足仏> = 0且恰有 y — 1个內頂点落在 X 軸上的路径，因此，它們的总 
数为 2 H 这就証明了我們的論断. 

5. 长的領先 槪率: 第一反正弦律 

我們說貭点在时刻 4 — 1到4处于其运动路径的正边上， 
如果其路径的第4边在 * 軸的上方，也就是說，^这两个頂 
点中至少有一个是正的(在这种 情形下 ，其它一个一定是正的或者 
0). 用賭博的語言来說,这就意昧着第々一 1_次和第4次 試驗某 
甲的累积赢利都是非負的. 

在第1节中所談到的关于路径的反直观的性貭可以由下述定 
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理推出. 

定理1 1) .令如, 2 „为从时刻0到时貭点有2々个时間单位 
处于正边上而有2« — 24 个时間单位处于負边上的槪率.于是 

P2i ， 2r = «2 々 M 2n-3 々 _ (5.1) 

(注 意： 在正边上的时間必須为偶数个时間单位 .） 

証.在时間区間（0, 2 n ) 中貭点一直处于正边的槪率由公式 
(4. 6 )給出，因此 p 2n%ln = « 2 n , 这就証明了当々=«时 （5.1) 成立. 
由于对称性，我們还有 po , 2 n = «2 n , 因此，只需对 
来証明 （5.1) 卽可.为此，我們再重复导出 （2.7) 的論証.如果貭点 
恰有> 0个时間单位处于正边，2« — > 0个时間单位处 

于負边，則貭点一定要通过零点.令貭点在时刻 2 r 第一次返回零 
点,則这条路径必須属于下列两族路径中的一族. 

在第一族中，到时刻 2 r 为 it , 貭点一直处于正边上，而在时間 
区間2/•到 2 n 中貭点恰有 2^-2 r >0个时間单位处于正边•长 
为 2 r 的在时刻 2 r 第一次返回原点的路径数共有 2 2 r f 2r 条，其中的 
—半保持在正边.此外，由定义 得知： 由 (2 r ，0) 出发的长为 2« — 2 r 
的恰有 2 k ~ 2 r 个边在 * 軸上方的路径数为 l ^- 2 r p 1 K - 2 ran -- lr . 
因此，第一族中长为2«的路径总数为 


~ ' 2 2n ~ 2r p 2 l>.-2r,2>i-2r ~ 2 2B_J f 2r p 2 々 _ 2 ,, 2 „_ Zr . 

在第二族中，在时刻0到 2 r 貭点一直处于負边，而在时刻 
到2«中貭点恰有个时間单位处于正边，其中 2 k < 2 n - 2 r . 
上面討論可知，这一族中的路径总数为 2 20 - 1 /2, f 2^,2 n -2 r . 

由此推出，对于— 1有 


Pikyin 



f2rPH—2r,2n—2r "I - ^ ^ hrPlk,ln—t，. 

2 r = 1 


(5.2) 


用归納法，假設 P 2 / I.ZV = W 2 ^«2 V -?< 对 W = l ，2，---， 《 — 1 成立 
(这个关系对 v = 1成立是不足道的）.于是公式 （5.2) 化为 


0第一次用分析方法証明这个定理的是鍾开萊和費勒⑽，而問題是在斯伯.安德 
生的工作中所提出的，参看 69 頁脚 j 主 2 ), 
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PlK >2 n 


U 2n-2K f2r u 2k~2r+ ~ w 2^ 〉: f 2r u 2n—2k.—2r 

2 r — t 2 r =： I 




(53) 


由方程 (4.10) 得知，第一个和等于《%而第二个和等于这 
就証明了 （5.1). 

直观上，我們覚得处于正边的总时間与总时間之比可能 


是近似地为 1. 然而，事实恰恰 相反： 靠近丄的槪率很小，而 
2 2 

两个极端情形= 0和々/« = 1的槪率却很大.这个結論可 

以用商检驗于 (5.1) 上来驗証. 

表1說明这个反直覌現象.用睹博的語言来說，这結論揭示 
了一个使人惊奇的 事实： 在扔= 20次均勻的錢币中，不幸运 
的賭徒沒有一次領先的槪率为 0.3524 .在較多的情现下（具有槪率 
0.5379)，不幸运的賭徒的累积贏利只有一次或一次都沒有为正 
的.为了对比起見，領先的次数之比为10： 10的槪率只有 0.0606. 


表 1. 在扔20次錢币中，領先的次数的分布 


1 

及= 0 
灸= 20 

弋= 2 
^ = 18 

々= 4 
々=16 

wBU 

w^m 

mm 

作，30 = ! 

0.1762 

0.0927 

0.0736 




^,90 = 

0.3524 

ram 

0.6851 


HI 

m 


= u k u „ 是路径中恰有々边在 a: 軸上方 的槪率，即是甲在20次笮驗中恰 
有々次領先”的 溉率. 

P^.ao 是賭徒中之一至少淆々次領先，而另一个至多只有20 次領先的俨率. 


公式 （5.1) 虽然是准确的，但是不够明朗，因此最好用一个簡 
单的逼近来代替它.应用第二章的史特令公式 可証： 当 《 — 03 
时 u 2 „ Mi->l [这就是第二章問題 （12.20) 的內容].由此推 
出 

Plk ，2« -----7， （ 5 . 4 ) 

(5.4) 中两边之比当 k .-* co , « — co 时迅速地趋于 1. 处于 
正边的总时間与总时間之比 々 A 落在音与《(含< « < 1) 之間的 
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槪率由 


S 丄2 - ±)}- 4 (5.5) 

<k<an T^tl \n<k<an ^ n ^ /? /J 


^n<k.<an T^tl ~n<^<a« ^ ^ 

給出.其右边是就是逼近下列积分的黎 曼和： 


{尤（1 一 «)}5 


27 r -1 arc sin a 蚤 


(5.6) 


由于对称性，々/»<丄的槪率当 》— oo 时趋于丄.把这个槪 

2 2 

率加到 (5.5) 去，我們得到 

定理2».(第一个反正弦律)对于固定的《(0 < a < 1)，处于 
正边的总时間与总时間之比 \/n < a 的槪率当 0 O 时.趋于 

« -1 ( --- = 2» r -1 arc sin «». (5.7) 

J MKi — 冰 

在实用上，公式 (5.7) 給出了一个很好的逼近，甚至对《的値 



1 寒 寄赛 § § g ir 

o o o o o o o o 


图 4. 反正弦律. 


1) 保尔 • 列威 (Paul L 6 vy ) 在[ 2 5]中对給定的連續扩散过程找出了反正弦律，而 
且 考虑了它和扔錢币的博奕的联系.至于一般的相互独立随机变量 序列的 .正 
的部分和的个数的反正弦律是由耳多斯 ( P . ErdSs ) 和卡斯 （ M . Kac ) 所証明的， 
参看口 6 ].至于民正弦律的組合性貭及其对随机变量的一般淸形的正 确性是 
由斯伯•安德生所茕現的， 


.SH . 
















在 20 左右，其逼近的程度都很好. （5.7) 中的被积函数的图形是 
一个 U 形曲綫，在其两个端点0和1处趋于无穷.这就令人信服 
地表明了处于正边的总时間与总时間之比接近0或者1比接近 

“期望”或“正規”値丄的可能性大.图4将要 表明： 

2 

处于原点同側的时間占总时間的97%的槪率为 0.20. 十次 
中就有一次，貭点以 99.4% 的时間处于原点同側.表2給出另一 
种解释. 


表 2. 反正弦律的解释 


P 

h 

P 

h 

0,9 

153.95 天 

0.3 

19_39天 

0,8 

126.10 天 

0.2 

8.93 天 

0.7 

99.65 天 

0.1 

2.24 天 

0.6 

75.23 天 

0 05 

13.5 小时 

0.5 

5夂45天 

0.02 

2.16 小时 

0.4 

34.35 天 

0.01 

32.4 分 


一 个錢币，每秒钟«它一次，一直扔 365天；令 Z 为不幸运的賭徒領 
先的总时間‘于 是化近 似地是使事件 z < tp 的槪率为 P 的数. 


这个表列出了一个不幸运的賭徒在全年中碩先的时間少于 G 
天的槪率？.例如，統計学家一般喜欢取置信水平 P = 0.05, 我們 
发現20次中就有一次使幸运的睹徒領先的时間大于％ 4 天零10 
小时.很少有人会 相信： 扔一个均勻的錢币会作成一个如此荒謬 
的进程，使得一百万次連續試驗中領先权永远不变，但是这正是— 
个好的錢币的規律性的結果. 

下一节我們将要硏究同一个現象的另外一类問題，而第7节 
則是用經驗資料来解释理論. 

6. 返回原点的次数 

反正弦律的解释說明了达样一个 事实： 貭点返回原点之前需耍进行很 
多次試驗.几何地說，其路径越过 * 軸的次数很稀有. 

直覌上，我們覚得某甲和某乙扔一个錢币 2 ” 次 （" 很大)时，其和局(累 
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积贏利相等的时刻)的次数应該与 2 » 成正比.但是，事实幷不如此.和局的 
次数仅仅依槪率与（2/0 1 / 2 成 比例； 这就是說，把賭博的次数增大后，和局的 
頻率迅速下降，因而“波长”增加.为了分析这个結果,我們将要考虑返回原 
点的次数.必須 記着： 粗糙地說,貭点由芷边进入負边或者反之的次数为返 
回原点次数的一半. 

定理 1. 令为到时刻2«为止貭点共返回原点 r 次的槪率.于是 

* 2 " ― jZn-r ( 2 " „ r )^ n>1 - ( 6,1 ) 

特別， ㉝ = 4 V = «2n ， 且 

= ( 6 . 2 ) 

如果用文字来叙述 ,（6.2) 說明： 和賭博持續的时間2»无关，不返回或 
者仅返回原点一次的槪率比返囬其它次数的槪率大. 

証.由公式 (4.4) 和 （4.5) 得知，长为 2 v 的沒有一次返回原点的路径数 
与最后一步返回原点的路径数相等.現在我們来考虑一条长为的在时刻 
2» — 2 v < 2 n 上第 r 次也是最后一次返回点的路径.从最后这次返回原点 
开始的长为 2 V 的路径数与从（2« — 2 V ，0) 出发到（2«， 0) 的路径数相等.換 
句話說，时刻 2 ” 以前恰返囬原点『次的槪率与吋刻 2 ” 返回原点且在此以前 
曾至少返回原点 》* 次的槪率相等，由第4节定理3，这就意味着 

# = 忠 + / i r „ +1> + 忠 +2> + …， (6.3) 

其中 / S 由公式 （4.11) 給出.容易驗証 

您= ^ T ( 2 ” D — — :一 L )， （ 6 . 4 ) 

对 y = r，r + 1, … 求和，我們就得到 （6.1). 至于 （6. 2)，那 是一个不足道 
的推論，这就完成了我們的鉦明. 

我們再用一个簡单的逼近来代替准确的公式 (6• 1 ). 为此,我們把 (6. 1 ) 

写作 

m ( i n . (,5> 

(【 _ 5)( i - a … g _ i) 

正如反正弦律的証明中所指出的 ，当” 一>00吋我們有 « 2 a { n „) W _ 

由对数的泰勒展式得知 log(l 一可以用 一 | 来逼近，其誤差的阶为 
( W ») 2 . 由此我們有下述漸近式（其誤差的大小的阶为 rV » 2 )： 


• 86 • 



10 1/2 « 1/2 )=-士文 


r 2 

~4« 


或者 必,為為 

返回原点的次数小于々的槪率 4°»> +忠 十…+ 4 f 〗> 


( 6 . 6 ) 

(6.7) 

可以由 7 t -^ 2 e- lfix：e 


从0到^=的黎#和来逼近，相对(百分比）誤差的阶小于 k 3 fn 2 . 因此，我們 
Y n 

有 

定理 2. 对于每一个固定的 a >0, 直到吋刻2»为止，貭点返回原点 
的次数少于«(2»)^ 2 的槪 率当” 一>00趋于 P 


f ⑷=(|) 



( 6 . 8 ) 


特刖，对充分大的》.来說，返囬次数少于 O . SZASpn ) 1 / 2 的槪率漸近地为 1/2. 


在第七章第1节中，讀者将要看到正态分布函数步 (《) = i-{l + /( er )} 
的表，由这个表，可以算出 /(«) = 2|^(«) — (对«>0). 


把一个錢币扔 1 D ，000 次： 返回原点的次数少于 6 S 的漑率为1/2,这其 
中有一半确实是改变領 先扠. 換句話說，邻近的两次改变領先权之間的平均 
“波长”的約为 3 C 0 的槪率是 1/2. _在扔1,000,000次綫疖中，返回的中位数 
只增加10倍，因此平均波长的增到大約等于 3000. 試驗序列愈长，返回原 
点的次数愈少，因而波长愈长. 

把一个綫币扔10,000次，不改变領先权的槪率大約为 0.0085; 在 
1，000_，000次拋挪中，改变領先权的次数少于10的槪率大約也为 O . OOM . 


7. 一个实驗的說明 

图5代表把一个錢币扔10,000次所得到的实际的 結果； 它是 
第一章例 (6. C ) 中所列的表的材料.最上面那条綫包含了前 5 50次 
試驗的图形，而下面两条綫代表10,000次試驗的全部图形，只不 
过这时沿*軸方向的单位縮小了一些.这两个图形中沿 y 軸方向 
的单位都是一样的. 


1) 提醒热悉中心极限定理的讀者：返回原点的次数不遵循正态分布.在 (6. S ) 中 
出現的是一个具有均値为 （2/； r ) V > 及方差为1 一 （ 2 M ) 的截尾的正态分布. 
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看到这个图形以后，很多人会对邻近的两次越 过 * 軸（卽是改 
变領先权）之間的波长是如此的长而感到惊奇.然而，这个图形表 
示的还是一个比較正常的情形，它是从三个可用的記录中选取其 
最正常的那一个.讀者可以沿相反的方向看看这个图形，也就是 
說把終点当作原点.[分析上，反路径由 （2.2) 給出 .] 理論上，图形 
中所描繪的点列与反向的点列是等价的，每一个都代表一个随机 
徘徊.反向的随机徘徊具有下述特性.从原点出发 

“貭点”停留在 


負 

边 

正 

边 

首先 

7804步 

其次 

8步 

其次 

2步 

其次 

54步 

其次 

30步 

其次 

2步 

其次 

48步 

其次 

6步 

其次 

2046步 



总数为9930步 

总数为70步 

时間 比例： 0.9930 

时間 比例： 0.007. 


这似乎是荒謬的，但是，把一个均勻的錢币扔10,000次，領先 
权在一边的次数大于9930次而另一边的領先权少于70次的槪率 
比 0.1 还要大一点.換句話說，平均来說10次記录中就会有一次 
比刚才所描述的还要坏.为了对比起見，領先权之差数比图5所 
描述的要好一些的記录的槪率是很小的,大約为 0.072. 

图5的記录中，包含了 142次返回原点，其中有78次改变領 
先权.上面所考虑的反向点列只包含14次返回原点，其中有8次 
改变領先权.这个奇妙的例証所启示的內容，使得一个有修养的 
統計学家都覚得扔10,000次錢币只有142次正反相等是一个惊 
人小的数目，至于只有14次那就更出乎意外了实际上正反相等 
次数大于140的槪率大約为 0.157, 而小于14的槪率为 0.115 .因 
此，与直观矛盾的，只有14次正反相等就完全不覚得惊 奇了； 在考 
虑改变領先权的数目的当时，我們还考虑过反向的点列，它与图5 
中的原始点列处于同一地位， 
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8 .附 录 

(a) 一 些等式的分析証明. 容易驗証 

〜= (_1) B (:士 )， hn = (-1) B+1 (|). (8.1) 

基本等式 (4.10) 可以考虑作第二章 （12.9) 当 a = — , ^ = - 丄的 

2 2 

n 

特殊情形.用同一个公式(求和）可得 D “ 2 r “ 2 , 一 2 r =1. 

r = 0 

公式 (2.8) 可以用心代替 L 2 k + 2 来改写，而且可推出第二章 

(12.9) 中 a =— 的特殊情形.另外，公式 （2.8) 可以由公式 
2 

(4.10) 利用等式 nr~\n - r )' 1 = r " 1 + (» - r ) _1 来推出. 

( b ) 最 大値的 位置： 第二反正弦律. 我們說路径 
•*•，&}的第一个最大値在位置夂如果 

^ > 0 , ^ > si, ‘‘‘，&> > s^ +1 , ••‘，&>&• ( 8 . 2 ) 

特別，如果 < 0对 : e 成立，則第一个最大值在位置 0. 
由公式 (4.6) 得知，长为 x = 2 n 的路径的第一个最大値在位置0 
的槪率为《 2)1 .由此也推出，对于一个长为 x = 2 n - l 的路径， 
其第一个最大値在0的槪率为 《 2 „. 

事件“第一个最大値在最后一个位置”就是巧<&对/ = 0, 1， 
•••,*- I 成立.对于反向路径 （2.2) 来說，这意味着彳〉0, 

>0, >0,这个槪率由 （4.5) 給出，它等于 ( 对 

* = 2” 或 x = 2 n + I 都对）. 

—条长为2«的具有第一个最大値在位置々的路径由下述两 
段所 蛆成： 第一段的第一个最大値在最后位置，卽是在位置々，而 
第二段的第一个最大値在起点，卽是在位置 0. 反过来，任何具有 
上述性貭的两段都可以組成一条路径，其第一个最大值在位置々. 
因此,我們有 

定理. 长为的路径，其第一个最大値的位置在 v 的槪率 
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等于 


\ u 2 hU ln ^2 k 当 ” = 2々（々 =1， 2, • • . ， 《)， 

或 y = 2々 +l (々 = 0，1, • • • , n — 1)， (8.3) 

t*2n 当 W = 0. 


値得注意的事 实是： 第一个最大値 位于从 或者+ 1的 
槪率等于 （5.1) 中的槪率 p 2k , 2 „, p lk an 是貭点在2«个时間单位中 
有2々个时間单位处于正边的槪率.由此得知反正弦逼近式可以 
利用，从而我們 断言： 最大 f 直位于两个端点中某一个的附近的傾 
向性很大. ■ 

領先的次数的分布 { 卽. 2 „}与最大値的位置的分布实际上相同 
这件惊人的情形在扔錢币的賭博中是不奇怪的.斯伯 • 安德生对 
一大族随机变量証明了一个类似的定理，他的証明的祖合基础与 
我們上面所应用的推理类似. 

( C ) 一个关于初过和返回原点的极限定理 1 第 6节中所 用到的估計司 

用来 証明： 对固定的 y >0, (4.11) 中的槪率/畀滿足漸近关系 


0( 各): 


1/2 


-iyV(2»-y) 


\ 7t / (2n — y) 3 ^ 2 


(8.4) 


符号~表示两边之比当》—>00时趋于 1. 用来証明第5节和第6节中的 
极限定理的方法現在可以推导出下面的結 論：第 次返回0 (或者初过 >0 
的位置在时刻 O 2 以前的槪率当 y ― >oo 时趋于1 — , 其中/(句由 

方程 (6.8) 所 定义. 

由此推出，第 y 次返回原点发生在时刻 （2. 21…) y 2 以后的槪率大約为 
1/2,因此，邻近两次返回原点之間的平均时間依 y 粗略地綫性增加.这对于 
习慣于取 y 次“測同一量”的平均作为“眞正”値的近似的物理学家来說，是会 
感到惊奇的.在現在这种情形，进一步的分析就会吿訴我們：在全部可能情 
形中，机会均等地 y 个測量中有一个的大小的阶与全部的和的大小的阶—— 
y 2 —样. 


1) 这就是本书第一版第十二章第5节的 定理夂 以前我們告 W 讀者1 - fir l n 
是所謂1/2阶的正稳定分布. 
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* 第四章 ” 事件的組合 

本章是討論关于由某些其他事件 A ， -', A n 所确定的 
—些事件.例如在桥牌游戏中，“至少一家有同一花色”的事件 
A 是由四个事件 A k { h . = 1, 2, 3, 4) 所成之倂，其中4是事件 
“第々家有同一花色”.由于諸事件4可能一个、两个或多个同时 
发生，也正因为有这些重迭关系，所以 事件/ 的槪率幷不是四个槪 
率 P { A K } 之和.对于給定的一組事件為， …， a n , 我們将 
說明如何去計算其中有0个，1个，2个 ，•… 同时发生的槪率. 

本章內容在弗雷謝 ( M . 的专著中可找到，如果讀者 

要作进一步的了解，可参閱这一专著. 

1 •事件之併 

設 zil 与是两个事件，則 = U ^^2表不 Zl 或 Z2 或两 
者同时发生的事件.由第一章 （7.4) 式我們有 

P{^} = P{A} + PU 2 } - PUtA 2 }. (1.1) 

現在，我們希望将此公式推广到 N 个事件表， A 2 , A n 的情 
形;也就是說，我們想要計算事件“至少有一个4发生”的槪率，这 
事件可用符号 A = 来表示.为此，仅知道每 

个事件4的槪率是不够的，我們还必須知道关于事件的所有 
可能重迭的全部知識，也就是对于每个二元組（》_， /), 每个三元組 
(*, U 々），等等，我們必須知道本与4•，或/,.，/,•与4等等同时 
发生的槪率.为了便于表达，我們将用字母 P 加以适当的下标来 
表示这些槪率.于是 

Pi = pi,i = ^{ AiAj }, pi , j, k = Aj A k }, - - - (1.2) 


1) 此章內容在以后不很明显地用到，仅第一个定理相当重要. 
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此处，下标的先后次序是无关重要的.但是，为了統一起見，我們 
将按下标数字的大小順序来书写；因此，我們不写？ W .11 而写 P 3. W ,. 
二个下标永不相等.令乂表示所有具有个下标的 P 之和，卽 
定义 

5i = 2?/, s 2 == Y^pi.i, s 3 = • * • C 1 - 3 ) 

其中 *•</<々< … < N , 因此，在和里每一袓合出現一次而且 

只是一次;故 S r 共有个項.最后的一个和知仅有一項〜, 3 ,...… 

卞就是所有 iV 个事件同时实現的槪率. 当 N = 2 时，只有两項\ 
与& ，幷且公式 （1.1) 可写成 

P { A ) = 5 t — S 2 . (1-4) 

对于任意 iV 个事件的情況，可推广成如下的定理. 

定理.在事件 A 2 ，…， A n 中，至少有一个实現的槪率 
Pi 由下式 給出： 

Pi = Sj — S 2 + S 3 — ~1 - - - - ±* Sn . (1.5) 

証.用所謂“包含与排斥”的方法来証明 (1. 5 X 参看問題 26). 
为了計算尸,，我們要把含在至少一个次中的所有样本点的槪率都 
加起来，而每个这种点的槪率只能加一次.为了有系統地进行，首 
先累加那些只含在一个次中的点的槪率，其次是那些洽含在两个 
事件次中的，依此类推，最后是那些含在所有洗中的点（如果有 
的話）的槪率.現在，設£为任一样本点，它恰好含在这 W 个事 
4 件的；》个中.不失一般性，我們可以将事件組 {<} 重新編号，使緬 
号之后 ，五恰 好含在 ^ i , A 2 ,- - ■ , A n 中，而不在 A n+1 , A „ +i , ■ ■ • , 
A 中.于是， P 彳五}将出現在各个外， P ,./， P “ i , k ， … 之中，此处 
的下标数字都是从1到„.故 P {£ } 在&中出現》次，在&中出 

現 ( 〗 ) 次等等.总之，当 （1.5) 的右边用样本点的槪率来表示时， 

得到了 P {£} 出現的次数是 



栗証明这个定理，只須証明这个数等于1便够了.把( I . 6 )与 (1 — 0" 


，93 • 



的二項展开式[参看第二章 C 8.7)] 作比較，立刻就可以得到这个結 
論.因为 （1 — 1)” 的展开式中的第一項是1，而紧接着的各項便 
是 （1.6) 各項的反号.故对于每个》> 1，表达式 （1.6) 都等于1， 
这就証明了定理. 

例. （ a ) 在桥牌游戏中，設4为“第家有同一花色”的事件, 
則朽= V ( H ); 第纟与第/两家同时都有同一花色的事件的发生 
共有4 . 3种可能的方式，幷且有槪率朽 .,• = 12/ GD ( n )； 同理， 
p t ,uk - 24/(5 D ( il )( ff ). 

最后， ^1.2.3,4 = 因为当三家中每家都有同一花色时，第四 

家必然也有同一花色.因此某一家有间一花色的槪率是 Pi = 
4 卢 1 一 6^1,2 4- 4 九 ,2,3 — ?1,2,3.4. 利用史特令公式，可以近似地得到 

= -- 10- lu . 在这个特殊的情形， Pi 很相近于不的槪率之和， 
4 

但这幷不是常規，而是一个例外. 

( b ) 欠0今.孟德模 （ Mcmtmort ) ( l 7 。 8 ) 首先提出下面的有种 
种 变形和奇妙的解答的問題. 它曾被拉普拉斯与許多其他作 
者推广过. 

設有两副同样的紙牌，每副各有 iV 张不同的牌.把这两副牌 
都均勻地洗过之后，就将此两副牌依它們的次序逐一翻看对比. 
若在两副牌中，同一 位置的 两张牌恰好是相同时，我們就說有一个 
相合.因而，相合可以在 W 个位置的任何一处发生，也可以在若干 
个位置上同时发生.这样的試驗还可以用更有趣的形式来描写. 
例如，我們可用 iV 封信与 W 个信封来代替两副紙牌，而設想一个馬 
虎的秘书把信与信封随意地相配.或者，我們也可以把卞設想如 
下： 把泯放在衣帽間的帽子随便地发还給宾客，若某一客入所得^ 
的帽子恰好是他自己的，則說有一个相合.我們値得来想一下一个 
相合发生的槪率与 iV 的 关系： 在一个有8个客人的餐館中，帽主 
与其帽子有一个相合的槪率同10,000人中有一个相合的槪率相 
比較将如何呢？人們将威到杳怪，实际上，这槪率差不多与 iV 无 
关，总是近乎2/3 (对于較有价値的应用，可参看問題10, 11), 
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在第 4 节里，我們将計算恰有0, 1，2, 3，，••个相合的槪率. 
这里，我們仅仅求出至少有一个相合的槪率为了表达簡单起 
見，赴我們将紙牌編上号数1, 2, 3, …， A % 幷假定有一副紙牌是 
按它自然的順序排列的，而另一副紙牌的每一种排列都有槪率 

士. 令山为在第々个位置上这两副紙牌出現相合的事件.这 
NI 

意 味着： 編号为4的牌排在第4个位置:，而其余的 2 V — 1张牌可 

以任意的順序来排列.显然 ， ~ 1)! =丄.同理，对每 

N ! N 

一祖我們有~ = (iV ~ 2)! = — 等等.在和\ 

N1 N(N — 1) 

中包含有个項，其中每一項都等于因此\ =丄及 

r ! 

(1.7) 
( 1 _ 8 ) 
(1.9) 

下表中 Pi 的准确数値可說明 （1.9) 的近似程度是很好的. 

N = 3 4 5 6 7 

Pi = 0.66667 0.62500 0.63333 0.63196 0.63214 

2. 在古典占位問題中的应用 

現在回到把 r 个球随机地故到》个盒中的問題，設每种不同 
的放法都具有相同的槪率我們要求出恰有 m 个盒是空的漑 
率 Pmir, ft) 1 ). 

設4代表第々个盒是空的这一事件（々=1，2，一，》).在 

1) 这个概率在第二章問題（ II . 8 )中曾用完全不同的方式推出过.可把它与第3 
节中的例子比較. 


/ 




由 （1.5) 卽可得到所要求的槪率是 

Pi = ]_ — -i- —J - — — + _ • . 土 ―—— 
2! 3! — NI ’ 

注意，1 — Pi 正是展开式 

e 1 :=== ~ 1 — 1 + —- ■ ― l —- + — + * 

2! 3! 4! 

中的前 W +1 項.因此我們 有一个 良好的近似式 


?! ^ 1 


0.63212* 
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这事件中，所有 r 个球都放到其余的»-1个盒里，幷且，这样的 
放法共有 O — iy 种.同理，預先指定的两个盒是空的放法共有 
(« — 2y 种，依此类推.于是得到 




Pi,i,k — 



因此，对于每个有 

-CX-lT. 


( 2 . 1 ) 

( 2 . 2 ) 


至少有一个盒是空的槪率由 （1.5) 給出，因此所有的盒都不空的槪 
率为 1 — >Si + Sj 一 + - ■ • j 或者 


A^，”) = g(_l)《:)(l -打. （2.3) 

現在我們考虑一个恰有 w 个盒空的分布， 这饥 个盒可以有 

(二)种方法选取. r 个球分布在其余的 n — 个盒中，因此这 

样的分布共有 (《 — w »)> o ( r，n — w ) 种.除以 〆 ，我們发現恰有 
m 个盒是空的槪率为 

Pm( r y ») ==( 二 X 1 ■- ~) 卢 n — rn) = 




(2.4) 


我們曾經采用》•个随机数字的模型来譬喻”个物件任意地放 
人 10 个盒中.此时，空盒对应于数字的不出現.若 w 个盒是空 
的，則 10 —m 个不同数字就出現在所給出的序列中.表1供給我 
們一个数値的实例. 

显然，在 （2.4) 中，直接的数字 m 算是在》与 》■ 都較小时才是 
适用的，但占位問題只在 ”相当 大时才特別有兴趣.例如，若 
10,000个球任意地放到1000个盒中，究竟有多少机会发現一个空 
盒？在人数为2000的人羣中，发現一年中的某一天不是这些人的 
生日的机会又是多少？幸好，这类問題可以利用的•一个很簡 
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表 1. 当„ = 10时，按煦公式 （2.4) 所計算的槪率 p m { r , 10) 


m 

^ ― 10 

r = 18 

0 

0.000 363 

0.134 673 

1 

.016 330 

.385 289 

2 

.136 080 

.342 987 

3 

.355 622 

•119 425 

4 

.345 144 

•016 736 

5 

.128 596 

•000 876 

6 

.017 189 

.000 014 

7 

•000 672 

.000 000 

8 

.000 005 

.000 000 

9 

.000 000 

.000 000 


PmO , 10 ) 是在一列>■个随机数字中， 0 , 1 , 2 ,-. , 9 中恰有 
个不出現的概率. 


洁而叉令人滿意的近似法来回答.当》 — oo 时，其誤差趋于零. 

有关这近似法的討論是槪率論中許多极限定理的典型， 

• ' • • • 

于是，我們的目的在于討論当 《 — oo ， r — 00时公式 (2.4) 
的极限形式.在原 則上， 》•与》之間的关系是任意的.然而，比例 

i 是表示每一盒中物件的平均数.如果 i 很大，我們就不能期望 

n n 

有空盒，在这情形， p 0 { r , «) 近似于1而所有的 p m ( r , ») (/« > 1) 
都很小.另一方面,若丄趋于零，則几乎所有的盒都是空的.此时， 

n 

对每一固定的 w ，/> m ( r ， M ) — 0. 因此，只有中間情形才眞正有 
討論的意义. 

我們首先估計公式 (2.2) 中的量因为 { n - vy < in \< n \ 
显然，我們有 

» v (i - -^-y +, < i>! — ~y. (2.5) 

对 f 应用第二章 （8.12) 的两重不等式，我們得到 

{ ”厂 (v+r)/( " _1 °} v < v !5„ < { ne ~ Hn Y . ( 2 . 6 ) 

为了簡单起見，令 

no —" =又， （2.7) 
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丼假定 ，和》 以这样一神方式 上升： 使 A 停學亨序.于是，对每 
一固定的 V ， (2.6) 中最远的两端的数的比 i f 因此，我們推出 


& < 工和丄 r — S„ —■ 0* . (2.8) 

v! v[ 

由此推出 

poir , n) — ( — l) v — ^ 0, (2.9) 

n = 0 ^! 

或者 Po(r，《) — —0. 但（2_4)中 p 0 (r ， n — m) 的因子可以写 

成心，从而，对每一'个固定的 w， 都有 


PmCr ， n) — e~ k 


上一 0, 

m ! 


( 2 . 10 ) 


这就完成了下述定理的 証明： 

定理 1 ' 当”和，增大而使得 A = 保持有界时，則对每 

一个固定的 m , (2.10) 都成立. 

近似表达式 


* 在第一版的証明中，作者省■去了这一步，而直接考虑$ ■>[> 的情宄.在第二販 
中补充了这一步，伹証明不完全确切.例如令 r = ^則 ；I = ne ~\ =似-"~*0,当 
n ^- oo , 这符合 A 保持有界的条件，但 (2.6) 两边之比 

{ _ v+r , r v 3 (' i + r ) v a ( n + g a ) 

{ -nZi Vl = e ~ni，- v) = 

•一般不趋于 1. 故这一步的証明应略加改正及补充如下： • 

在題設的条件下，如果： 

(0 A -0, 則由 C 2.6) 〜■推得 一 5 v -*0. 


( ii ) 如 《•+(» 时， A >々 i >0, 則因 A 保持有畀，故存在々 3 , 0<^ i < A <^ a < cx 3. 

t __ r _ r 

这时 M < e - S < 与 ，因而 ^/|<<: _ 7<$,故= 亦即 0. 这时 （2.6) 

—y s < «H-r) 

两边之比为 e ~ nin ~ v) -1. 故仍有 - S v ->0. 

一般情况(即对应于整数《 (或 A 有一子序列凇敛于0,另一子序列保持大于 
稟一大于0的常数），均能保証上面极限关系的成立 —— 譯者注. 

_1)馮.来賽斯給 Hi 了一个不同的証明方法，参看[ 28 ]. 
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II 

£ 

0*0386 

.002? 








o 

11 

0.0630 

.0060 

.0002 







s 

o 

II 

c 

0.0935 

.0148 

.0008 







50 

11 

S 

0.1249 

.0325 

.0030 

i .0001 

1 






r>. 

II 

0.1482 

.0636 

.0096 

.0008 






\o 

II 

S 

0.1540 

.1033 

.0271 

• 0035 

.0003 





u-\ 

II 

e 

0.1371 

.1596 

.0655 

.0141 

.0021 

.0003 




Tf 

1! 

S 

0.1017 

,1951 

.1320 

.0471 

.0115 

.0023 

.0004 

.0001 


rr, 

II 

S 

0.0604 

.1909 

• 2128 

.1255 

.0506 

,0162 

.0049 

.0011 

.0003 

CN 

II 

s 

0.0269 

.1400 

,2575 

• 2510 

.1666 

.0873 1 

.0414 

• 0164 

.0064 

II 

s 

o 

OT 

O 

O 

in 

00 

\o 

o 

r>. 

rs 

ro 

ro 

VO 

<o 

ro 

vo 

o 

r*j 

— 

S 

o 

II 

o 

o 

to 

1-H 

00 

ro 

OO 

m 

<N 

r>- 

s 


CN 

5 

CO 

Os 

VO 

00 

00 


•3- 

g 

TT 

2.48 

1.50 

0.91 

0.55 

$ 

o 

s 

o 

fN 

o 



5000 

5500 

6000 

6500 

7000 

7500 

8000 

8500 

9000 


(I i • z) a} 3 ^^ s: 輙 st 靼 S 锢妫 <- s l(F^ -5- ,K* ffll 铜 <- g 2Y®^^ffi 1g <--<K<N ' 彬 
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pint ; A) = e^ x — —- (2.11) 

m ! 

称为普阿松分布，•它是一个非常重要的分布，它描述了各种現象； 

• • • # • 

在第六章将要仔細硏究它. 

实际上，当《相当大时，就可用 P («， A ) 作为一个逼近. 而对 
于不大不小的値就需要估計誤差.但是在这里我們不从事于 
誤差估計的討論了. 

例. （ a ) 当盒的个数是1000而球的个数在5000与9000之 
間时，表2給出了恰有 m 个空盒的槪率的近似値.当 r = 5000时， 
空盒个数的中位数是6 :出現7个或更多的空盒的可能性与出現 
6个或更少的空盒的可能性是差不多的.如果把9000个物件任 
意分配到1000个盒里，則可发現一个空盒的机会是 1/9. 

( b ) 在生日的統計中[第二章例 （3. d )]， 《 == 365, r 是人数. 
当 r = 1900时，則近似地有 A = 2. 在一个1900人的乡村里， 
—年中有 / w 个日子不是生日的槪率可近似地表之 如下： 


尸 [0] 

= 0.135， 

尸⑴ 

= 0.271, 

P [21 

= 0*271， 

P[3] 

= 0.180, 

? [4) 

= 0.090 , 

P[5] 

= 0.036， 

P[6l 

= 0-012， 

尸 [7] 

= 0.003. 

用同样的方法可以 推出： 

恰有 

«个盒，每个都含有々个物体 


的槪率.而馮 • 米賽斯曾經 指出： 这个槪率也可以用普阿松表示 
式 （2.11) 来逼近，只不过要把 A 定义为 

X = (2.12) 

3. N 个事件中实現 m 件 

第1节的定理可以加強如下面的 

定理. 对任何正整数1 < W 在 7 V 个事件為， •..， 

中恰有 M 个同时发生的槪率 Ptml 为 

P tml = 〜 3 0 + (^ 3 2 ) - + 
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+ … ±0. (3.1) 

注意： 根据 （1.5)， 沒有一个為•发生的槪率 P M 为 

= 1 - = 1 — + 5 2 - 5 3 ± ••- (3.2) 

这指出了，如果取& = 1,(3.1)式对 w = 0时也是合理的. 

鉦.我們采用 （1.5) 的証明方法. 設五是 任意一个样本点 5 # 
設它恰好含在 2 V 个事件4的》个中，則仅当 n = m 时样本点£ 
的槪率 P {2?} 才是槪率 P tm ] 的粗成部分.現在，我們来覌察 P { i ?} 
在 （3.1) 右边出現的情况，注意， P { fi } 只在和 S l5 S 2 , - ■ ■ , S „ 中出 
現，而不在 S „+ i , S „+ 2 , ‘ _ _，〜中出現.于是，当》<^»时， 

在（ 3 .1)右边不出現.当《 = 时， P {£} 恰在心中的一項出現. 
要完成定理的証明，只要証明下面的情況便可以了，卽当 n>m 
时，在 （3.1) 右边的項心， S m+1 , 中， P {^ E } 的出現的次数应 

該恰好相消.由于包含£的《个事件可以組成(^^个 々重組 ，故 
P { i ?} 在 A 中共出現 ( 0次.因此对《 > P { 五 }在( 3 .1)右边 
出現总的次数是 


⑴- e 


+ 


+1, 


平 





(3.3) 


t V )L + v ) = d n 一，) ，所以 (3.3) 可写成 



(3.4) 


在花括号內恰好是 （1 — l )” i 的二項展幵式，因此 (3.3) 式化为零. 
这正如我們所断言的. 

例. 讀者可以 驗証： 把 （2.2) 代入 (3.1) 直接推出公式 （2.4). 


4. 在相合与猜测問題中的应用 

在例 （ l . b ) 中，我們考虑两副紙牌的相合問題，幷求出 
5^=1 A !. 将它代入 (3.1) 就得到下面的 結果： 
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設有两副同样的紙牌，每副各有 w 张不同的牌，在两副牌的随 
意配对中，恰有 m 个相合的槪率可以給出如下 

1 ^ 1 丄 1 


P [0]: 

=1 一 1 + — 



2 ! 

3! 

戶⑴ 

― L — 

1 + 

J - i-H 



2! 3 \ 

? C2 ) 


1 — 

14- 

2 ! 1 


2 ! 

P [3] 

= i { 

1 — 

1 + -1- 

3! 1 


2 ! 




土 --- T _ 

0—2)! (A/—1)! N\ 


-不 . 




3! 


3! 


H —— 


(2 V —2)! ( N —1)! 

1-1 


(4 J ) 


- 4 -— 


平 - 


0V—3)! (A/ —2) 


OV -3)! J ’ 


P [IV—2) 

P tW-1] 


1 


GV—2)! 
1 

( ZV —1)! 


心- 1 + *}， 
- {1 — 1} = 0， 




最后的一个关系是显然的. P [ N - i ] 为零 表示： 有 W _ 1个相 
合而沒有所有的 iV 个相合是不可能的事件. 

在 (4.1) 式右边的花括号內恰是^展开式中的前若干項.故 
对于相当大的 W ,我們有近似式 


tn ! 


(4.2) 


下頁表3中給出了 / V =3, 4, 5, 6, 10 时所对 应的諸的准确 
値与极限値，每行中的前一行給出了 的准确値，而最后的一 

行却給出 了它的 极限値 

Pm = ~— . (4.3) 


从表中可以看到 心对 的近似是相当良好的，甚至对于不大 
的 iV 値也行. , 

(4.3) 所定义的数値有如下的性貭：=厂 1 (l + I + 
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Ami 由 (4.1) 給出， h 由( 4 . 4 )給出.最后一行由普阿松极限0*- 3 )給出. 


丄+丄+ . • ^ = 1. 因此， 〜可以 解释为槪率. 注意： 

2! 3! / 

(4.3) 为普阿松分布 (2.11) 当又=1的特別情形. 

公式 (4.1) 在試驗猜測的能力时是有用的.在尝酒鉴定及在 
心理試驗等等，是使猜測者說出（或呼喚）一組未知順序的汉个物 
件，例如紙牌.要是猜的人眞有点“秘訣”的話，就会有非随机性表 
現出来.要想从他的猜中率来判断有沒有“秘訣”，我們須要算一 
算运气的槪率.随机的猜測可依照几神方式来进行，而我們仅叙 
述其中三个极端的可能情形. 1) 猜測者始終保持呼喚一个固定的 
紙牌，則在 iV 次呼喚中，他一定有一个且仅有一个猜中，因此，猜中 
次数沒有随机的起伏. 2) 在 iV 次呼喚中，猜測者每张牌都呼喚一 
次，則 AT 次呼喚就对应于] V 张紙睥的一个排列，若猜測者沒有什么 
秘訣，則公式 (4.1) 可以应用. 3 )在 W 次呼喚中，猜測者每次皆可 
猜測 AT 张牌中的任意一张，卽 iV 次的猜測是彼此独立地 进行. 此 
时，共有种可能的排列.实际上，每人有其固定的心理习慣， 
往往会傾向于呼喚某些牌比其他的牌要多一些，但在初步近似中， 
我們可以假設所有种排列鄱是等槪的，由于猜中 m 个而其佘 
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N — m 个不猜中的排列共有 — l ) w — m 种，故恰有阳个猜 
中的槪率是 



(这是二項分布的特殊情形，在 第； 章例 (4.c) 中 E 推出 .） 

表3給出了按照方式 2) 和方式 3) 进行試驗时，其猜中 tE 率的 
比較.为了判断两种方式的短长，我們需要均値与随机起伏的理 
論.在这两种方式下，猜中的平均次数都是1，而方式 2) 的随机 
起伏比方式 3) 来得大些.从表3中可看到，实际上，它們之間的 
差別不是太大. 

. I ' 

5•杂 录 


( a ) 至少有 m 个事件实現.沿用第3节的符号，在事件為， 
A 2 , •••, 中，有 功个或 更多个事件同时发生的槪率可以由 
下式給出： 

Pm = P[m] + P [m+1] + … + P M. (5_1) 

要求由 & 来表达 P ra 的公式，最簡易的途径是采用归納法.从公 
式 (1.5) 出发，应用递推公式 P m+1 = P m - P [ ra ] 卽可得到，当 
1 时，有 

Pm = Sm ~~ {m — l) 5m+1 + (m — l) Sm+2 _ ~ l) 5m+3 + 

+ ••• ± C-0 5 - (5 . 2) 

此外,还可用 （3.1) 的結果直接导出 （5.2). 

(b) 其他恒等式.我們用或 P * 来表达茲叙述 如下： 

5 - = 2( S ) P W 5 (5-3) 

&=敛二]：)〜 （ 5 - 4 ) 

証明提示. 对于給定的値 P W , 方程 (3.1) 可視为 未知数 & 
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的綫性方程，我們要証明 （5.3) 是它的唯一■解.若把 (5.3) 代入 P U1 
的表达式 （3.1) ，則右边 Pu ] (7 W <々< AT ) 的系数是 

±(-0-(： XJ )-( i )±(- l )-(^ I ：). (5.5) 

当时，奏达式( 5 . 5 )等于1 .当々> /«时，（ 5 . 5 )是 （1—0*1 
的二項展幵式，故为零.因此，将 （5.3) 代人 (3.1) 后， 卽得彳 互等式 
Pui = ?[ m ]. 方程 （3.1) 的解的唯 一* 性是根据这样的 事实： 每个 
P lra ] 的方程 (3.1) 只加一个新的未知数心， 故& 可以逐步地算出. 
我們可以用类的方法証明 （5.4) 的正确性. 

( c ) 彭費雷尼 （ Bonferroni ) 不等式.用下面的方法可以得 
出有关 P [ m ] 与 P „ 的一系列不等式.如果在 (3.1) 或 (5.2) 中，只保 
留心， 5 m+1 , …， 5 m+r _! 等項而把 S m+r , S m+r+1 , S N 等項株 
去，則其誤差（卽眞値減去近似値）的符号与所抹去的第一項的符 
号（卽 （ 一 i )9 相同，且其絕对値是小于所抹去的第一■項的絕对値. 
特別，当/ • = 1与 r = 2时，有 

•5* — («» + 1)*5«+1 ^ J °[ m ] ^ S m , (5.6) 

5 m - mS m+1 < < S m . (5.7) 

証明提示.要証明关于 (3.1) 的陈述，只須 証明： 对每 一 #,有 

(5.8) 

利用 （5.3) 将不等式 (5.8) 的左边写成 P W 的綫性祖合，則对于* < 
的系数等于 

± J )= U )± (-1 广 !：)• 

后者之和为所以 PuA 的系数是正的， 

故得証(参看第2章問題 （12.13)). 关于更深刻的不等式，讀者可 
参考本章开始时曾提到过的那篇弗雷謝的专著. 
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6 •問 題 

注.假設在下面的每个情况，所有可能的排列都是等槪的. 

I •从放有10双鞋子的橱子里任取4只鞋子，試求所取出的4只鞋中至 
少有两只配对的槪率. 

2 •—次攤出五个骰子，試求其中至少有三个点数相同的槪率 C 幷用第二 
章第5节的方法驗証之）. 

3•把一个錢币扔5次，試求正面至少連續出現3次的槪率. 

4 .把一个錢币扔10次,求芷面至少連續出現5次的槪率. 

5 •在上述两題中，以骰子代替錢币，么点代替正面，求其相应的槪率. 

6•把两顆殺子擲 r 次，試求在对子（1， 1), (2, 2), …，（6, 6) 中，毎对至 
少出現一次的槪率 p r . 

7 •了节斧”宁印四张面値相同的牌我們称之为四同.因此， 
一付13张桥牌中可以士 0, 1, 2或者3个四同.算出对应的槪率. 

从一个具有”个人的总体中抽取一个大小为，的样 
本.求出 W 个指定的人全被抽在样本里的 槪率〜 [这就是第二章問題 
( 11 . 12 )]. 

9 •字 . 在現在无放回的情形回答类似問題8的問題，幷証明 

問題8 p n (这就是第二章問題 (11 .3)，不过現在的方法推出一 

个完全不同的公式）. 

10 •在 W 阶行列式的一般展开式中，包含一个或多个对角綫上的元素的 
項数共有其中巧由（1.7)所确定. 

II .把 8 只城状的（国际象供)拱子放在拱盘上，使得彼此都不能被吃掉 
而且沒有一个在白色的对角綫上.試証这种放法的总数是8! (1 — 巧），其中 
A 是由 （1.7) 所定义，而 N = 8. 

l 2 . T 个毕# (贈卷收集者）—副由，类每类有《张所构成的牌 
中，每一 — 标 i 数字1，2,…， 《. k 这副牌无放回地抽取一个大小为 r^n 
的随机样本.算出每一个标号都出現在样本中的槪率 《,. (把这淸形应用到 
s = 4 ,«= 13 的桥牌中去，我們得到一付 f 张桥牌中包含全部13种面値的 
槪率；而应用到13, »= 4的情形中去，我們得到四种花色都拿到了的 
槪率 .） 

1 3 (續上）.証 明：当 / ―>00时有— > p 0 { r , n ), 其中最后一个 
式子由（ 2 . 3 )所定义.这就意 味着： 在极限情形，我們的抽样变成了从一个 
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具有数字1，2,…，》的总体中的有放回的随机抽样. 

H (續上）.从問題12的結果推出 ：如果 r < n ， 有 


玄 ㈠ ”⑴⑷一办二°， 

**=0 \ ^ / 

当 r = / j 吋有 

*-0 \〆 

用求 


(1 - x y 


- r+l 


(1 - (1 - ^) J }* 


在* = 0的 r 阶微商的办法驗証上述方程. 

15.在抽样問題12中，求出恰巧抽 r 次就得到了全部数字的槪率.考虑 


j — a = 的极限情形. 

16. 一个紬胞中含有 JV 个染色体,其中任意两个之各部分都可以交換.如 


果发生了 》■ 对交換(共有 ( gy 种不同的方式发生），求出恰有”》个染色体卷 
人其中的槪率 ' 

17. 从一付紙牌中，任意取出5张求5张中恰好缺少々种花色的槪率. 
U . 試求在任取13张的桥牌中，恰有4对同花的爱司和老开的槪率. 

19. 两副 N 张不同的牌，每副同时与第三副相同的牌进行随机 

相配，求4淪；个复相合的槪率〜，幷証明当 N ―03时，一> 1 [这吿 
訴我們当 mSU 时 ， 《 m - > 0]. 

20 - Mmf . 前題中的做法可修改 如下： 从张牌中任意取出 W 张， 
幷将此^张^第三副牌进行随机相配，求沒有一个相合的槪率，幷証明当 


N —>00吋，这槪率趋于上. 

C 

21 .葶 ，令.在問題 2 G 中，若将两副牌改为 r 副牌，求其相应的槪率. 
占位問題中，恰有历个盒含有々个物体的槪率％„] (幻是 


P [ m ](々） 


(―1 产 n !， 


丄 2(— 


(«- iy -^ 


(; — «)!(» — i ) l { r — 


式中的和夸是对 你 且 ki ^ r 求和 • 

23 .証明当 k = 1时，第2节最后一段的叙述是正确的. 


24.在波司-爱因斯坦的铳計中，利用 （3.1) 可导出恰有个盔盒的槪率. 
25 .用第二章中的公式 （11.14) 来驗証24題中所得到的公式. 

26•对 2 V 作归納法証明公式 （1.5), 


1) 当 ZV = 6的情形，参看 [29]. 
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第五章条件槪率.統計独立性 

1. 条件槪率 

条件槪率的槪念是槪率論中的一个基本工具，然而不幸的是， 
由于一个特殊粗陋的术語使它不是很簡明了.下面的討論是用一 
种比較自然的方法来导出其形式的定义. 

預备例子. 設在] V 个人的总体中，有 iVj 个色窗者而且有仏 
个女的.若事件 j 及 H 分別表示随机选取的一人是色盲的及是女 
的（随机选取的定义可参閱第2章第2节），則 

P { A }^= P { H } = (1. L ) 

N N 

現在，以所有女人耝成的子总体代替总体的位置，我們来計算女人 

中随机选出的一人是色肓的槪率.这槪率是~，其中 n ah 是色 

ZV H 

窗女人的数目.这里，我們沒有用什么新的槪念.但是，在硏究某 
个特定的子总体时，我們需要用一个新的記号来表达.一般所采 
用的符号是 P { A \ H }, 可讀为“在事件 H (所取出的人是女的）发 
生的假定下，事件 /( 色肓者)发生的槪率”.采用符号 

P { A \ H } = ~ (1-2) 

N h P { H } 

显然,每一个子总体本身总可以被考虑为一个总体;为了語言 
上的方便起見，我們說一个子体时，意思就是說背后还有一个較大 
的总体.保险公司可以对由于雷击(事件 Z ) 引起的某种产値額的 
災害頻率是多少感覚兴趣.一般来說，保险公司的保险項目有好 
几类，如工业的、都市的、彡村的等等.单独硏究工业項目的保险 
費意味着只硏究事件/仅联系于事件 H ——“保险費是化在工业 
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項 目的' 这时公式 （1.2) 显然可以应用.然而 注意： 对千一个 
只，經营工业保险的保险公司来說， H 与整个样本空間重合，因而 
PUiH } 变为 P {^}. 

最后，我們考虑坐在北边打桥牌的人.一副桥牌分好了以后， 
他知道了他手中的牌，因而他威兴趣的是剩下的那39张牌的分 
布.把这39张桥牌的一切可能的分布的集合作为样本空間是可 
以的，但是，把它們和北家手中的13张牌（事件 H ) 联系起来考虑 
幷且討論假定事件 H 实現时事件 W (例如南家手中有二个爱司）的 
槪率就会更方便一些.公式 （1.2) 又能应用. 

类似 (1.2) ，我們現在来引进下面正式的 
定义. 令 H 是一个具有正槪率的事件.对于任何事件/， 
我們記 

PU\H} = $ 當 . ( 1 - 3 ) 

这样定义的量称为在//假設下（或者給定 H ) J 的条件槪率.当 
所有的样本点都是等槪的时候， P { J | H } 就是 J 和 H 的公共的样 
本点的数目与//中的样本点的数目的比 N ah / N h . 

当假設 H 的槪率是零时，条件槪率 P { W | H } 就沒有定义了. 
在离散样本空間的情形，这一点是无关重要的，但是，在一般理論 
中却是很重要的. 

:.虽然記号 P {^| H } 本身是实用的，但是它的詞句的表达却如 
此之长，以致实际上是采用較为簡略的描述，例如，在上面所引入 
的例中，我們用一个女人是色盲的槪率来代替“在假定已知为女人 
的条件下，随机选取一人是色盲者的条件槪率”.我們經常以“若 
知道发生”来代替“在7/的假定下”.总之，我們的公式与記 
号是很明确的，而詞句的表达往往是非正式的，因而需要有正确的 
理解. 

为了称呼上的淸楚起見，对样本空間中的槪率，有时我們用絕 
对槪率这个名称.严格地說，“絕对”两字是多余的，幷且可以略 

去. 
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对于一个特定的假設 H , 考虑各种事件的条件槪率就相当于 
把 H 視为一个新的样本空間，幷且，为了使新的样本空間的总槪 
率为1，故需将原空間中所有事件的槪率都乘上因子这 
个叙述 說明： 所有槪率的一般定理，对在任何特定假設 H 下的条 
件槪率依然成立.例如，我們可以叙述/或 S 或二者同时发生的 
槪率的基本关系 如下： 

P{A U B | H } = P { A \ H } -h P{B | H } — P { AB \ H }. (1.4) 
类似，在第四章中，关于 A / ■个事件有 《 件实現的槪率的全部定理改 
为条件槪率的情形也仍然成立.但是，我們幷不需要它們. 

我們往往应用以下面形式所表示的公式 （1.3) 

P { AH } (1-5) 

这就是所謂复合槪率定理.为了推广到三个事件 A , B , C 的情 
形，可先取》= 作为假設事件，幷再一次利用公式 （ L .5)， 卽得 

P { ABC } = P {^| BC } P { fi | c } P { c }. ( 1 . 6 ) 

这可直接推广到四个或多个事件的情形. 

最后，我們来討論一个簡单而又常用的公式.設玛 ，… ，扎 
是一組完备互斥事件（卽 H ls • • • , H „ 之幷集是整个样本空間，且 
H l5 • • • , 是互不相容的），則任何事件 X 只可能与某些 H , 联合 
发生，卽 

A = AHil ) AH 2 U • • • U AH „, (1.7) 

由于諸 AH f 是互不相容的，故 j 的槪率是 AH t 的槪率之和，再利 
用 （1.5) 于只=玢，卽得 

P { A } = ZP {^| H ,} P { H ,}. (1-8) 

这个公式是很有用的，因为計算条件槪率 P { J | H >} 有时要比直接 
計算槪率 P [ j } 容易一些. 

例. （=0 无放回抽样.从一个拥有”个元素1, 2 ，…， 《的 

• • • • • 

总体中抽取一个有序的样本.令；和；是两个不同的元素，假定 
i 是第一个被柚出来的元素（事件 H ), 第二个元素是/ (事件/0 

的槪率是多少？显然， P { AH } - — ~~ = 

n\n __ 1) 


• 110 « 



迖 說明： 第二次抽取是对于具有《 — 1个元素的总体来进行的， 
其中每一个元素被柚中的槪率都有相同的槪率.事实上，随机柚 
样最自然的定 义是： “当前「次抽取完成后，剩下的》 — r 个元素 
中的任何一个在第 r + 1次被柚出的槪率都是1/(« - rT . 这个 
定义等价于第二章所給出的定义，但是我們不能在較早时叙述它， 
因为其中包含了条件槪率的槪念. 

( b ) 四个球連續地放进四个盒里，全部4 4 个排列都是等可能 
的.給定前两个球放在不同的盒中（事件 《), 某一个盒恰巧有三 
个球(事件 3) 的槪率为何?給定 H ， 事件3有两种不同的方式发 

生，所以 P { A \ H } = 2 • 4~ 2 = (可以容易地直接 驗証： 事件 

8 

j 和分別包含 12 • 4 2 和12 • 2个样本点 .） 

( c ) 考虑恰有两个小孩的家庭.今以〜 g 分別 
表示男孩 iii / i 定年长的孩子的性別用前一个字母来表示， 
則有四种可能的情形从，灯.这四个样本点的每一点都 
賦以槪率 1/4. 若 e 知一家有一个男孩（事件 h ), 間这一家的两 
个小孩都是男孩的槪率是多少？因事件卽 衫, 而事件 H 为 紐 

或岵，或妙，所以 P {^| H }=— ,卽在具有特征 H 的所有家庭 

3 

中，大約有1/3的家庭可以預期发生事件这是很有趣味的，因 
大多数人所想象的解答总是 1/2. 事实上，1/2却是另一个不同 
問題的正确解答，这問 題是： 随机地遇到一男孩，幷发現他是属于 
有两个小孩的 家庭； 問这家庭的另一个小孩也是男孩的槪率为何？ 
这两个問題的不同之处可解释 如下： 在第一个問題中，我們所面 
临的是一系列的家庭，而第二間題則是面临着一系列的男孩，在后 
者，有两个男孩的家庭共有两种可能情灭，这就說明了这两个結果 
的不同之处. 

( d ) 兮亭孕序.假定一羣人由一些子羣或者阶层珥，/^… 
所构成.是民族，年龄，职业等等.令内为任取一人他 
属于 《,• 的槪率.說“味中的一个人是习慣用左手的槪率是分/% 
意思 是指： “在此人属于坤的假定下事件 j (习慣用左手）的条件 
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槪率' 随机地柚取一个人，他是习慣用左手的槪率为 Mi + p 2 qi 
+ p 3 q 3 + • • •，这是 (1.8) 的一个特殊情形.假定此人是$慣用 
左手的，他属于 H / 的条件槪率为 

P { H ,\ A ) =- 渔 - • (1-9) 

Pl < l \ + P 2 fll + . •. 

2. 用条件槪率所定义的槪率.罐子模型 

在前一节里，我們酞为槪率当然是定义在样本空間中的，幷且 
只算了一些条件槪率.在应用中，許多实驗都是用某些特定的条 
件槪率（虽然通常把形容詞“条件”省略了）来描述.在理論上这 
意味着：样本空間中的槪率可由給定的条件槪率中推导出来.曾 
經指出过（例 ( l . a )) 无放回抽样的最好的定 义是： 不管前，次抽 
取的結果是什么，在第 r + 1 次抽取时，剩下的每一个元素被柚 
出来的槪率都是一样的.类似地，在例子 （ l . d ) 中，我們的分层总 
体完全被几层的絕对槪率灼和每一层中的特性“习慣用左手”的 
条件槪率？，所描述.用較多的例子来启示一般的模型比直接的描 
述更有效. 

例. （ a ) 在第一章例 （5. b ) 中，我們曾經考虑过三个游戏者 
a , b , c 在一場游戏中互相替換的 問題； 我們曾經描述过样本空間 
中的点子，但是沒有賦槪.現在我們假定这一場游戏这样 进行： 
在每一次試驗中，任何两个对手获胜的槪率是 I / 2 .虽然这种叙 
述幷未包含“条件槪率”这个詞，但是却无形中与它有关联.譬如 
說： 如果某游戏者《参与第 r 輪（事件 H )， 則他在这一輪获胜的 
槪率是 1/2. 由方程 （1.5) 推出，游戏者《在第一次和第二次游戏 

都获胜的槪率是1/4,用符号来表示，卽是 P { aa } = —. 重复地应 

4 

用 （1.5) 可証 : P { acc } = — , ^{ acbb } = 等等； 卽是，方案 

8 16 

( 木 ） 中包含 r 个字母的样本点具有槪率 2 ' 这就是第一章問題 
5中所賦予的槪率，但是現在的描述更直覌（在問題14中継續）. 

( b ) 家庭.我們要解释下面的叙述.“一个家庭恰有々个小 

• • 
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孩的槪 率是以 （其中 Po + ?1 + ••■ = 1). 对于每一个家庭来說， 
所有的性別的分布都是等槪的”.令6表示男孩 S 表示女孩，我們 
的样本空間由样本点0 (沒有小孩）， b , g , bb , bg , gb , gg , bbb , -- - 


所組成.引号里面的第二个假定可以更明确地叙 述为： 如果知道 
該家庭恰有》个孩子，2” 个可能的性別分布中的每一个都具有条 
件槪率 2—". 而这假設的槪率是内，于是从 （1.5) 我們 看出 ： »个 
字坻 6 和 S 的每一种排列的絕对槪率都是 N • 2 ~\ 

注意， 这是分 层总体 的一个例子.孩子数为/的家庭构成第 
j 层 H “ 作为一个例子，令 j 表示事件“該家庭有男孩无女孩”. 
显然，其槪率为 PU } = Pi 2 ~ x + p 2 2~ 2 + …，这是（ I . 8 )的一个 
特殊情形.在这种情形下，假設吊就是“家庭有/个小孩”.現在 
我 們問： 如果知道一个家庭沒有女孩，該家庭仅有一个小孩的(条 
件)槪率是多少？其中3是假設.令 H 表示事件“仅有一个小孩”， 
則表示“一个小孩而沒有女孩”，而且 


P{H\A} 


P{AH} = __ 

P{A} p{T r 4 - 朽 2— 2 + W 3 + … 


， （2.1) 


这是（ I . 9 )的一个特殊情形. 

( c ) 亨亭譽 pSpf 爭寧.为了确定起見，我們考虑一个容易 
出事故的工业系事 ic 的发生可以用一个机会游戏的結果来描 
述.一个罐子里有黑球和紅球，在每一■段規定的时間区間里随机 
地取一个球，紅球代表事故出現.如果事故出現的可能性对时間 
来說保持不变，則“罐子的成分”是常常相同的.但是可以想象，每 
—个事件是有一个后效，使得或者增加或者減少一次新的事故发 
生的可能性.这对应于一个成分可以改变的罐子，其成分根据依 
賴于順續柚取的結果的某种規則而改变.构造出这样一个規則去 
槪括各种情形是容易的，但是，我們只討論下面的模型4 


1) 月罐子模型去搭述后效（传染病）似乎是由波利亚 （ Polya ) 提出的.在一些文 
献中討論的許多模型都把他的方案（最初在 P 0] 中引进）作为典范.本书中所 
描述的模型及其三种特殊情形是由弗雷德曼 （ B . Friedman) (参看 PU ) 所提 

出. 
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Jp 于寧 f . 一个罐子中包含 6 个黑球与 r 个紅球.随机地抽 
収一个 i . i •放回地抽样，幷且再加进 c 个与所抽出的球具有同 
样顏色的球和 J 个相反的顔色的球（这时罐子中就有 r + b + c 
+ d 个球了），这种手續反复地进行，其中 c 和 J 是任意的整数. 
c 和 d 可以取为負数，不过在这种情形下經过有限次取球以后会 
因为无球而停止.特別地，取 <7 = — 1 ， d = 0,則我們的抽样就 
变成了无放回的抽样，它在，+ 6次以后就結束. 

現在，我們轉向数学描述. 注意： 某些基本的槪率可以通过 
它所确定的条件槪率来計算.对应于》次抽取的样本空間的典型 
的描述法是用”个字母《和 K 的序列来代表其样本点.事件“第 
—次取出的是黑球”(卽是第一个字母是 S 的全部序列所构成的集 
合）的槪率为 b!ib + r ). 如果第一个球是黑的，則第二次抽出的 
球仍为黑（条件）的槪率为 O + c ) A > + r + c + d ). 因此，由 
(1.5) 得知序列黑，黑（卽是以 SB 开始的样本点的全体）的（絕对） 
槪率为 


b b c 

序列黑，黑，黑的槪率为 （2.2) 乘以 U + 2 c )/0 + 

等等.显然，用这种办法可以算出每一个样本点的槪率.（当然， 
当 c 和 d 是負时，取球的次数》必須选得足够的小，以避免球的个 
数出現負数 .） 用归納法可以容易地 驗証： 所有的样本点的槪率 
的和必須为1 . 

槪率的明显表达式不是很容易得到的，除非在下面要介紹的 
一个最重要的而且著名的特殊 情形： 

竽嚷于寧寧，其特征是2 = 0, C > 0. 每一次柚取以后， 
这时“球有目同顏色的球的数 s 增加，而与取出的球的顏 
色不同的球的数目保持不变.在效果上看，每一次取出的球是什 
么顔色增加了下一次也取到这种顔色球的槪率，因此，我們得到了 
—个如传染病現象的粗链的模型，其中，每一次传染以后都增加再 
传染的槪率.波利亚模型在分析上的簡单性是由下述明显的性貭 


( 2 . 2 ) 

r + 2 c + 2< f ) , 
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所导出的：在次抽取中，其結果为个黑球个紅球 + 

= n ) 的任何一个序列的槪率都与最初柚出&个黑球而后取出〜 
个紅球的槪率相同，卽是 

_ ^>(^+<r)(^ + 2<r) - ■- (^b-¥n\C 一 c') • r( r + <r) • • • ( r-\-n 2 c 一 c') 

(6 + r )(6 + r + c)(£> + r + 2c) • • •(厶 + r + »c —— c ) 

(2.3) 

把分子分母都除以 d 并引用第二章 （2.1) 的符号，則上式可 
写为如下的 形式： 


Pn x t ft 



(^J ： + „ — i) 





(2.4) 


(波利亚模型在問題 18 —24中討論 .） , 

除了波利亚模型以外，我們的罐子模型还包含另一个有趣的 
特殊情形， 卽是： 两个隔离壁之間热交換的爱伦弗斯特 ( Ehrenfest ) 
模型如物理学家所应用的那样，在最初的描述中，爱伦弗斯 
特模型考虑的是々个貭点分布于两个容器中的情形.随机地选取 
—个貭点把它由它所在的容器移到另一个容器中去.这种手續反 
复地进行.問》步以后貭点的分布如何？为了把它化成權子模 
型，只需把第一个容器中的貭点叫作紅球，第二个容器中的貭点叫 
作黑球.于是在每一次抽取中，球抽出来換上一个相反的顏色的 
球，卽是 c = -1, 1. 显然，在这种情形下，这种过程我們要 

継續多久就可以継續多久（如果沒有紅球，則自动地抽出一个黑球 
幷換进一个紅球）.[在第+五章例 （2. f ) 中，我們将用另一种方 
法討論爱伦弗斯特模型 .] 

对 c = 0, ^ ；> 0的特萍情形，曾經由弗雷德曼提出作为一个 
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安全运动模型.每当发生了事故（卽紅球被取出），安全运动就秫 
紧 一些; 而当沒有事故发生时，安全运动就放松一些，于是发生事 
故的槪率就增大. 

Cd ) -寧节―亍寧寧，渾彳，举.为了継續沿着上一个例子的 
綫索进行 iii ，'我 X 假 y 每二;又都可能遇到意外事故，而且它們 
的发生取决于从一个罐子中随机地取一个球所得的結果.然而， 
这时我們假定是无后效的，所以，罐子中的成份在整个过程中保持 
不变.因为意外事故出現的机会或傾向性可能会因人之不同而不 
同，会因职业之不同而不同，所以我們設想每一个人（或者每一种 
职业）都有他自己的罐子.为了避免不必要的复杂性，我們假定只 
有两种人（或两种取业），而且其数目之比为 1:5. 然后，我們考 
虑第一个罐子含有 h 个紅球与〜个黑球，第二个罐子舍有 r 2 个 
紅球与匕个黑球.实驗“随机地选取一个人，幷考察 他在〃 个萆 
位时間內发生了多少次意外事故”具有下述的对应 关系： 擲一顆 
骰子，如果么点出現,則选第 一罐； 否則选第二罐.在每一种情形 
下，都是从这罐子中作《次有放回的随机抽取.我們的实驗描述 
了一个保险公司接受一个新的保险戶的情形. 

利用 （1.8), 我們 得出： 第一次抽出的球是紅的槪率为 

P { i ?} =丄 +- 5 -—^―， (2.5) 

6 b x + r x 6 ^2 -H r 2 

而序列紅，紅（及及）的槪率为 

( 2 . 6) 

在我們的模型里面幷沒有包含什么数学問題，但是，它却具有 
—个很有趣的性貭，这种性貭在应用中会引起很大的混乱.假定 
我們的保险公司覌 察出： 一个新的保险戶在第一年中发生了一件 
意外事故，从而他关心这一个新的保险戶在第二年发生意外事故 
的槪率.換句話說，假定第一次抽出的是紅球，我們問序列灭尺的 
(条件）槪率是多少？显然，比 p { i ?^?}/ p {^} 不等于为了 
解释这一■点，我們假定 + r :) = 0,6和 r 2 /(^ 2 + r 2 ) = 0,06, 
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于是在任一次油取中，収出紅球的槪率为 0.15, 但是，如果第一次 
柚出的是紅球，則第二次抽出的仍然是紅球的机会为 0.42. 注意： 
我們的模型在全部的总体中是无后效的，但对一个随机地选出的 
人来說，他发生了一件意外事故以后会增加此人发生第二次意外 
事故的可能.这里，我們得到了抽样的影响；一次意外事故的发生 
幷不眞的产生什么影响，但是它却指出随机地选出的人发生意外 
的可能性有增大的傾向. 

在铳計文献中，习慣于用传染这个詞来代替后效.抽样的表 
面上后效最初誤解为眞实的传染效果，所以統計学家現在說到传 
染（或传染槪率分布）时都是含湖不淸的.例如，生态学家在田野 
里找寻見虫.如果在一段无成效时間以后他找到了一个見虫，他 
会 断言： 有巢穴，大槪在附近，而且他再找到一些見虫的机会是很 
大的.显然，这其中幷未包含任何后效性，而統計学家把这个說成 
是传染. 

(0 下面的例子是很著名的，同时具有例証的作用，只可惜有 
挂人为 造作.設想一个总体中有 W + 1个罐子，每个罐子都有 W 
个球，在第々号罐子中有々个紅球与 iv— 々个白球（々= 0, 1 ，2 , 
今从 2 V + 1个罐中任意取出一罐，丼从这罐中作有放 
回的”次抽取.假設取 出的” 个球都是紅球（事件/)，求在下一 
次（第《 + 1次）仍然取出紅球（事件 S ) 的（条件）槪率.設第 
一次所取的罐子是第々号，則在以后 ”次取 球中都出現紅球的槪 

率是因此，由 （1.8) 我們有 


P { A } 


+ 2° + • • - + N" 
N\N + 1 ) 


( 2 . 8 ) 


事件表示相継（~ + 1) 次取球中都出現紅球，于是有 

_卜_ = 1 〜二 二二产 . ⑽ 

故所求的槪率是 P{B\A} = P { B }/ P { A }. 

10(2.7 ) 与 （ 2 .S ) 可考虑为近似于积分的黎曼和.因此，当 iV 相 
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当大时，有 







钕对足够大的. V ，我們有 


P {£ 


A) 


n ~i~ X 

n 2* 


(2.9) 


( 2 . 10 ) 


公式 (2.10) 可粗略地解释 如下： 若罐中所有的成分都是等槪的， 
且在” 次有放回的取球中都出現紅球，則在第》+ 1次取球中仍 
然出現紅球的槪率是 （《 + 1)/(« + 2 ). 这就是所謂拉普拉斯 
(1812) 延續律. 

关于貝依羝 ( Baye *) 公式的附註 .在 （1.9) 与 (2.2) 中，我們曾經直 
接从定义出发来計算某些条件槪率.我們 臥为： 初学者最好常常这样做， 
而不要去死記我們現在将要导出的公式 (2.12). 公式 (2.12) 追溯到我們曾 
耕过的特例的普遍情形，其实它仅是公式 （1.3) 的另一种写法.設有一組 
完备 E 斥事件 Hi ， 《2, • • • ，卽每一个样本点必属于一个而且也 R 能属于一 
个 H ;, 則我們所感兴趣的是 


( 2 . 11 ) 


( 2 . 12 ) 

若将事件称为原因，則 (2.12) 成为《关于原因槪率的貝依斯法則 * .在 
数学上 ，（2.12) 不过是公式 （1.3) 的一种特殊写法而已，而在上述例 ( b ) 与 （ d > 
所描述的类型的許多統計应用中，公式 （2. 1 2 )是很有用的.但遺憾的是，由于 
例 （0 类型的結果形式地乱用，以致使 Bayes 公式不硖人信任.在照例应用 
时，这种論証可能出毛病.一个貭量控制的工程师常是关心某架指定的机器 
而不管达架机器是否从无穷多个机器的总体中任意抽取出来的.仅是基于 
邏輯上的可以接受同时又附合我們的想法，他就采用 Bayes 公式. Pl «。 曾 
用这种論証来証明大西洋的存在，而哲学家們用它来証明牛頓力学的荒_. 
但是对于我們工程师来說这种論証忽略了如下的 情况： 工程师期望成功，幷 
旦他可以估計与減小来自預測和猜測的各种錯誤，以便作得更滿意.近代 


若将公式 （1.5) 与 （1.8) 代入 （2. 11)，則有 
P{h k \a)= 
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統計检驗与統計估計的方法虽然較少直现性，但頗現实.因此，它不仅姑被 
証明为芷确的，且:: JJ 实上可以应用. 

3. 統計独立性 

在 b 面各例中，条件槪率 P{A\H} 一般地不等于絕对槪率 
P {^}. 通俗地說，我們对事件 H 是否发生的知識会改变事件 J 出 
現的把握.只有当 P{A\H} = P{Z} 时，迖种知識才不能影响我 
們对于事件2的发生与否的推想.这时，我們 就說： J 与 H 是統 
計独立的.但公式 （1.5) 表明了条件 PM|H} = P{A} 可以写成 
如下的 形式： 

P{AH} = P{A}P{H}. (3.1) 

这等式关于/与/_/是对称的，幷且还說明当3与 H 紋計独立， H 与 
A 也統計独立.因此，我們最好还从下面对称的形式来下 定义： 

定义 1. 两个事件 Z 与 H 称为是较計独立的（或簡称独立）， 
若等式 （3.1) 成立.当 P { H }=0 时，虽然 P {2| H } 是沒有意义 
的，但此定义仍可采用.統計独立是随机独立的同义詞. 

例. （ a ) 从一副紙牌中任収一张，由于对称的理由，我們可 
期望出現“黒桃”的事件与出現爱司的事件是独立的.事实上，它 
們的槪率分別是1/4, 1/13;而它們同时发生的槪率确是 1/52. 

(b) 抛擲两顆般子，“第一顆骰子出现么点”的事件与“第二顆 
骰子出双数点”的事件是独立的.因为这两事件同时发生的槪率 
是3/36 - 1/12,而迖正是它們分別的槪率1/6与1/2之积. 

( c ) 在（《，办 ， q 四个字母的排列中，“《在6前”与‘ V 在 

d 前”是独立的.这在直观上是显然的，幷且也容易礆証. 

(d) 毕巧 兮市.我們回到例 （1. c) ，但現在所考虑的是有 
三个小孩“贏幷假設所有八种可 能情況 bbb , bbg , •••, ggg 各 
有槪率 1/8. 令//是“家里男女孩子都有”的事件，而 /是“ 家里至 
多有一个女孩”的事件.于是 P { H } = 6/8，而 P{AH} = 3/8 = 
P{^!}P{ii}. 于是，在家庭中有三个小孩的 情祝下 ，这两个事件是 
独立的.但是，当所考虑的家庭有两个或是四个小孩时， Z 与 H 就 
不再独立.这說明了是否具有独立性幷不总是显然的. 
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若事件发生,則其逆事件 H ' 就不发生，反之亦然.統計独立 
性隐含茬不能从事件 H 的发生作出对 事件/ 的任何推断.因此， 
A 与7/的独立性也就是 W 与 H ' 的独立性（由于对称性，/与//及 
/ I '与！ J ， 也是独立）.利用 P { H '} = 1 — P { H } 就很容易驗証这 
个結論.若公式 （3.1) 成立，則（因 j / J ' = J . JH ) 

P{AH'} = P{^} - P{AH} = P{A} - PU}P{H}= 

= P{A}P{H l } i (3.2) 

这正是我們所期望的. 

現在，設三个事件 B 与 C 是两两独立.于是 
P{AB) =P{A}P{B}, 

P{AC} =P{A}P{C}, (3.3) 

P { BC } = P { J 5} P { C }. 

人們可能猜想，两两独立总会隐含着象 ZS 与 C 那样的一对事件 
的独立性.但是，迖不一定对，我們可以举出反例說明 （3.3) 虽然 
成立而要事件 B , C 同时发生是不可能的，于是，与 C 就 
不会独立了. 

例. （0 擲两顆殺子，幷定义如下的三个 事件： w 是“第一顆 
骰子出奇数点”，是“第二顆骰子出奇数点”，最后 C 是“两顆般子 
的点数和是奇数”（卽一个是奇数点而另一个是偶数点）.若36个 
样本点的每一个都有槪率1/36,則任何两个事件显然是独立的， 
且每一个事件的槪率都是 1/2. 当已知其余两事件之一发生时， 
它的条件槪率也是 1/2. 但三个事件不可能同时发生.当 Z 发生 
而 S 不发生时則保証了 C 的必然发生.对于所有其他的組合也有 
类似的結果. 

要使随机独立性不会有上述的情形发生，除 （3.3) 必需滿足 
外，还要添上下面的 假設： 

P{ABC} = P {^} P { B } P { C }. (3.4) 

这等式保証了 d 与 SC 的独立性，幷且也保証了 S 与 WC ， C 与 
/4 B 独立.甚至还可以証明 JUS 与 C 也是独立的.事实上，由 
第一章的基本关系式 （7.4), 我們有 
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P { OU 5) C } = P{AC] + P{BC} — T{ABC}, (3.5) 
把 (3-3) 与 (3.4) 代入 (3.5) 的右边，則可提出一个公共因子 
而余下的因子是 PU} + P{B} - P { dS }= P {/ UB }， 于是 

P {(^ UB ) C } = P { A \ JB } P { C }, (3.6) 

这样一来，可以相信，在两个条件 （3.3) 和 （3.4) 成立之下，可以 
毫无困难地 証明： 凡能用 Z 和 B 的蛆合所表示的事件均与 C 独立. 
对于《个事件的普遍情形，我們有下面的 定又： 

定义 2. 事件 A x , 称为相互独立的，如果对所有 

可能的組合1 < ; < 7 ' < 々< • • . < «，以下的乘法規律 成立： 

PU 々 } =PU}PU }， 

P { A , A , A k ) = P {^,} P {^ ; } P {^}, , 、 


- -A„} = F{At]P{A 2 } - - -P{A„}, 

第一行代表 ) 个等式，而第二行代表 ) 个等式，…，等等. 

因此，所要滿足的'条件共有(^) + (】)+ = — 

( l )-( o )=2 B -«- L ^. 另一方面，第一行的 ( ^ ) 个条件 

足以保証这些4的两两独立性.方程祖 （3.7) 看起来似乎是一 
个复杂的条件袓.但是，它們的成立往往是很明显的，而 a 不需要 
驗証.由归納法可知[从 n = 2和 （3.2) 出 发]: 

在定义2中，系統 (3.7) 可以由2” 个方程所构成的系統来代 
替，这些方程組是从 (3.7) 的最后一个方程把任意个為換为它們 
的互补事件4而得出的. 

两两独立与相互独立的区別在理論上的意义远胜于实际 t : 的 
意义.两两独立而不彼此独立的实际例子几乎是不存在的.这种 
情形发生的可能性是由 S . 伯因 斯俎发 現的. 

4.重复試驗 

統計独立性的槪念使我們有可能分析地叙述“在同一条件下 
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JR iT 試驗的直观槪念. 

%虑代表臆想試礆的样本空間 s , 它的样本点是 Er , E 2 …， 
幷且它們的槪率分別以外，为，•…表示.在两个相似試驗的体系 
中，所有可能結果（心，心）是組成一个新的样本空間，对迖些新 
样本点 (£；, E 0, 槪率的确定有很多种方式.然而，若实驗考假 
定： 两次試驗都是在同样条件下进行的，卽隐:含着独立性.也就 
是說： 第一次試驗的結果不影响第二次的結果,卽“第一次出現 
E / ! 的事件与“第二次出現；£广的事件是統計独立的，故有 

P{Ej, E k ] = p ： p k , (4-1) 

对于每一可能結果 (£；, ^),等式 （4.1) 給出一个相应的槪率. 
但在采用 （ 4 . 1 ) 作为新样本空間的槪率定义以前，我們必須証明这 
些内外之和为1 . 在和 >]2>收中，每項恰好出現一次，所以 
Hp ; Pk _ = (?i + + • • • )(?i + 巧 + . . • ) = 因此， (4.1) n ]" 

以作为槪率的定义. , 

設』和 S 是原来样本空間6上任意的两个事件.用 S ) 
表示“第一次試驗 发生/ 而第二次試驗发生 B ”. 假設事件3舍 
存样本点 £ ai , . E a 2 ， .•- 而事件 B 含有样本点£\，£■&， • • • ，則事 
件 ( A , B ) 是所有对子 (£ a/ , E bk ) 之幷.正如前述，我們有 
P {{ A , B )} = = (S 〜 ）（2 = 

= PU } P { B }. (4-2) 

因此，事 f 牛 X 与 B 独立.可見由定义 （4.1) 出发，可以 推出： 第二 
夂試驗中的任一事件都对第一次試驗中的事件独立.从槪率論的 
角度来看，这恰好刻画了“相同試驗”. 

这些考虑也可推广到 r 次試驗的体系，幷可导出 
定义 1. 令 S 是具有样本 点氏， E 2 ，… 的一个样本空間， 
对应的槪率分別为朽，&， •. 所謂对于 e 的，次独立試驗是指 

由 r 元組 ( E h ，■■■, £y,) 为样本点的样本空間，幷以如下的 
方式定义槪率 

PiC-E；!- Ej., … ， £ ； v)} = Ph Pi z - ' - Pi r . ( 4 . 3 ) 

換言之，新空間的每一■点可視为由原空間的点祖成（可以 JE 
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复）的大小为 r 的一个样本，幷且由乘法規律 f 4.3) 来确定新空間 
上的槪率.讀者必須 記住： （4.3) 幷不是定义槪率的唯一方法.換 
句話說，重复試驗幷不一定是独立試驗.例如，波利亚罐子模型 
[例 （2. C )] 定义了相依（非独立）的重复試驗.等式 (4.3) 定义了独 
立試驗，用物理上的話来說，就是在同样条件下的重复試驗. 

用导出 （4.2) 的推論，可以更普遍地用来証明下面定理的正确 
性. 

定理 . 設一組事件 A 2 , •••, A r , 其中4的发生与否仅 
由第/次試驗单独判断，那么，如果試驗独立，卽如果 (4.3) 成立， 
則事件 A r 彼此独立. 

若空間 S 含有有限多个（設 iV 个）样本点，則新空間有 AT 个 

样本点 (E h , E h , …， E ir ). 5^6的每一点有槪率丄，則由(4.3)， 

N 

点 ( E u , • • • ， E, r y 的槪率是 N ~\ 新的处理方法想来要比等槪 
的形式上指定还要耔，因它可用于非等槪的样本空間，也可以用于 
无穷的样本空間.对于漑率的一般理論，这更是一个不可少的工 
具，因为在一般理論里，那怕我們只做一次单独試驗，我們也把它 
考虑成一串試驗的第一个.这使得我們总是在考虑着試驗結果的 
无穷叙列 ( E h , E h , •••), 幷且用一种方法来确定新空間的漑率， 
要定得与 (4.3) 沒有矛盾.遺慽的是，新空間不是离散样本空間， 
故这样的討論超出了本卷书所限制的离散样本空間的理論.为了 
保持本书中理論的初等性，我們所付的代 价是： 必須按照試驗的 
次数改变样本空間. 

在前面的討論中，我們仅仅考虑同一个試驗的重复进行.但 
是，不同的試驗的継續也可用同样的方法来处理.倘若我們先扔 
一个錢币，然后擲一个骰子，則我們自然假設这两次試驗是独立 
的.这相当于用乘法規律来定义槪率.因此有 PK 正面，么点 ）}= 

丄•丄，等等.在这特殊情形，就等价于定义这所有的12个样本 
2 6 

点都是等槪的.但在一般的情形，必須用 （4.3) 的方式来定义槪 

率. 
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定义 2. 設 f 与 e" 是两个样本空間，分別用 . 与 
F ：；, Et, 来表示屯們的样本点.幷設其相应的槪率分別为 
p [, p'h - - •与, • • •. 則相継的两次試驗可以由样本点（£;， 
£*) 所組成的样本空間来描述.我們說两次相継試驗是独立的， 
意卽用下面的式子来定义槪率 

!*{(■£;• ， W)} = PipK. (4.4) 

[刚才31进的槪念在槪率論里沒有什么特別意义.給定两个具有普通 
的点子 E ' 和 E " 的盎間 S ' 和 S ", 全部的 （ E ', E ") 所构成的集合称为疔 
和 S" 的組合积，通常用 e ' xS " 来表示.例如，点 o , y) 所构成的笛卡尔 
平面就是 r 軸和 y 軸的組合积.（三維苕問旣可看作 A ", 平面和軸的組 
合积又可看作三重的組合积 .） 方程 (4.4) 定义了通常所謂的 6' 和 S " 中槪 
率的乘积測度.我們所用的試驗这个詞等价于一个在其中定义了槪率的样 
本空間.类似地，两次独立試驗的継續可以考虑为对应的样本盔間的組合 
积，其槪率由（ 4 . 4 )所定义. 

这些槪念可以很容易地推广到任意多个空間的乘积中去.例如，在 
( 4 .3) 中描述了 6自身的 r 維組合积.这里，初学槪率論的人說第一，第 
二，…次試驗，而一些数学家們則应用 术语： 第一，第二，…个坐标空間. 
( 只依賴于第一次試驗的結果的事件也叫作第一个坐标空間中的柱集 .）] 
所有的数偶 （《', /) (其中 f 和） 都是介于1和》之間的整数）构成了整 
数集1, 2,…，》到自身的乘积.在无放囬抽样中，数偶 （/, 0是不尤許的， 
因此，大小为 2 的无放回抽样不能直接构成乘积苕間.然而，如下面的例 
子所証明的，可以用一种不同的方法去表示它，这种方法考虑为相継的独立 
試驗，而且这种方法可以应用到更复杂的情形中去. 

例. （ a ) 坪豕我們曾考虑由《1， 的”！ 个不同 

排列所組成的样本空間，每个样本点賦以槪率丄.这样本空間也 

n \ 

可由相継的 o — 1) 次試驗来表达，現叙述 如下： 先把^写出，第 
一 次試 驗是将 a 2 放在 的前面或后面，放完后，則有三个位置 
可以放置〃 3 ，于是，第二次試驗是将 a 3 放到三个位置中的任一个位 
置，这就决定了 《 2 , a 3 的一个排列.有四个位置可以放置 — 
般地，当 A，a 2 , •••，9按照某一次序排定之后，我們就进行第走 
次試驗，卽把 〜 +1 放在々+ 1•个位置中的任意一个.換言之，在相 
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継的 （》_ 1) 次試驗中，第々次試驗共有々+ 1个可能結果（卽样 

本点），且每个可能結果有槪率由于試驗是独立的,于是， 

C<+1) 

按照原始的定义，《个元素的任一組排列的槪率为丄.丄 •. .丄. 

2 3 » 

(b) 設总体是（的，内，…， 《„：>. 在无放回 

的柚样中，每次抽取都拿掉一个元素.因此，在第々次柚取以后， 
余下的只有《 — &个元素，而下一次柚収可以由該元素所选择的 
第V号 (v == 1，2, •••， 《 — 々）位置来描述.如此，无放回地抽取 
一个大小为的样本变成相継的 r 次試驗，其中，第一次試 驗有” 
个可能 結果； 第二次有《— 1 个; 第三次有《— 2个，…等等.在 
每次試驗中，所有可能的結果郡賦以相同的槪率.假定 r 次試驗 
独立，达就相当于按照随机样本的定义，每个大小为 r 的样本都賦 
以槪率 l/(n) r . [注意，当 tj = 100, r = 3时，样本 ( a 13 , a ^, a iX ) 
表示选取的号碼分別为13, 39, 79. 我們应該說，第三次試驗是 
从剰下的 （《 — 2) 个元素所构成的总体中抽取第79号允素，而对 
于原来的号数而言，第三次的試驗結果是与第一次、第二次的結果 
有关的 .] 我們可以看到，重复独立試驗的槪念使得我們能把抽样 
問題的硏究看成是相継的个別运算. 

*5. 在遺传学中的应用 

孟德尔 （G. Mendel, 1822—1884) 創始的遺传学理論对簡 
单的槪率模型的适用性提供了一个富有教益的例解.下面我們只 
局限于討論一些最初等的問題.在描述生物学的背景的时候，我 
們必須使之簡单化幷集中于那些便于数学处理的事实. 

遺传性状依賴的特定携带者，称为遺传因 子' 除了生殖細胞 
或者配子以外，人休中的每一个細胞都具有同样的遺传因子結构. 
明显的事 实是： 遺传因子成对出現.讀者可以把它們設想为一大 

* 有星号的小节为处理特殊的主題，可以略去，以下相同. 

1) 原书錯写为 iM ——譯者注. 

2> 原文为 gene, 遺传学中一•般都称为墓因 —— 中譯本辑者， 


• 125 * 




堆穿在一段短綫上的珍珠——染色体.这些染色体也成对出現， 
而配成对的遺传因子在配成对的染色体上处在相同地位.最簡单 
的情形是每一对特定的遺传因子中的每一个都只能取两种形式 j 
和因此，可以构成三种不同的对子，而且对于这些特定的对子 
来說，有机体属于这三种遺传型 AA, Aa, 咖（在与 Ja 之間不 
加区別) . 例如，豌豆携带这样一对遺传 因子： X 使之开紅花 ， a 
使之幵白花.在这种情況下，三种遺传类可以区分为紅花、淡紅色 
的花和白花.每一对遺传因子决定一个可遺传的因素，但是机体 
的可观察到的大多数性貭依賴于很多因素.对于某些特征（例如 
眼晴的顏色、习憤用左手）来說，某一对特定的遺传因子的影响特 
別大，在达些情況下，孟德尔定律的效果是容易观察到的.其它一 
些特征(例如长度），可以設想为一大堆遺传因子的效果的迭加[参 
看原书第+章例 （ 5 . c )]. 这里我們将要硏究一对特定的遺传因 
子的遺传型与維承的問題，对于这特定的一对遺传因子来說，它有 
三种遺传型 AA, Aa, aa. 一般来說两个遺传因子有 iV 种不同的 

形式為 ，…， ‘，因此就有0个遺传类 A t A u A X A 2 

AnA n . 在这种一般的情況下，理論需要作一些修正（参看問題 
27). 下面的計算也可以应用到当/具有显性而 a 是隐性的情形 
中去. 这就是說 A 这个个体与具有同样的可观察到的性貭， 
因此，对 a 因子来說，只有純如型才会表現出不同的可覌察到的 
影响.不完全显性的全部演变在自然界中会出現.典型的不完全 
隐性的性状是蓝眼睛和习慣用左手等等. 

生殖細胞或者配子是由分裂过程所产生的而且它只具有一个 
遺传因子.純//型和似型的机体（或純合子）只产生一种类型 
的配子，但是 A 型的机体（杂合子）产生同等数目的 W 配子与《 
配子.新的机体由两类上一輩的配子而得来，而且新的机体从双 
亲的配子得到屯的遺传 因子. 因此每一对都包含一个父系的遺传 
因子和一个母系的遺传因子，而且每一个遺传因子可以追溯到任 
M —代特定的祖先，不管是哪一代的远祖. 
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后代的遺传型依賴于一个随机过程.在每一时刻，每一个上 
— 輩的遺传因子以1/2的槪率传給后代，而継續的試驗是相互独 
立的.換句話說，我們可以 把第” 代的遺传型設 想为” 次独立試 
驗的結果，每一次試驗对应于扔一个錢币.例如 ，X 的后 

代的遺传型配成对时为 AA , Aa , aa , 其对应的漑率为丄，丄，丄. 

4 2 4 

一个 X ««的結合只能产生型的后代，等等. 

把总体視为全体，我們可以把亲本的配对設想为第二个随机 
过程的結果.我們将仅仅硏究所謂随机交配，它是用下述条件所 
定 义的： 如果在第一代子孙中随机选取个，則它們的亲本是所 
有可能亲本构成的总体中的一个大小为 r 的随机样本.換句話 
說，每一个后代可以視为随机选取的一对亲本的产物，而且所有这 
些选取都是相互独立的.随机交配是流行于許多自然界的总体及 
田間試驗的一些条件的理想模型.然而，如果紅豌豆播种在田地 
中的某一个角落而白豌豆播种在另外一个角落，則同一种顏色的 
亲本的交配比随机交配要来得經常些.优先选择性（如象淡顏色 
优先选择淡顔色）也与随机交配这一条件相违背.完全非随机交 
配可以用自花受精植物和人工授粉来代表.某些这样的交配系統 
将要数学地加以分析，但是我們大部分是注意随机交配. 

后代的遺传型是四个独立的随机选择的結果.两个亲本的遺 
传型的选择可以有3 • 3种方式，它們的遺传因子的选择有2 • 2 
种方式.然而，我們可以把这两个选择結合起来，幷且把这个过程 
描述为_这样一个双重的 选择： 父系的遺传因子和母系的遺传因子 
的选取是相互独立地、随机地从一个总体里抽取的，这个总体是由 
父輩的总体中的全部父系所携带的遺传因子和母系所携带的遺传 
因子的全体所构成. 

假定三轴遺传型 AA , Aa , aa 在父系和母系中以同样的比例 
«: 2 〆 如而发生.我們将假設 u + 2 v + w = \, 而且称《， 如 
为遺传型的頻率.令 

P U + V , Cf — + IV, (5.1 ) 
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显然，遺传因子/的个数与 《 的个数之比为 P - q , P + U 我們 
称 p ， q 分別为遺传因子 Z 和《的頻率.由于在每次选取中，遺传 
因子 J 被选出的槪率为 P ， 又因为假定了选取是相互独立的，所以 
某后代是的槪率为 P 2 . 遺传型可以用两种方式发生，所 
以它的槪率为 2 pq . 因此，在随机交配的条件下，一个后代属于 
4 A ， Aa 敌 aa 的漑率分別为 

«1 = p 1 , 2 t/i = 2 pq , u/j = (5.2) 

例. U) 所有的亲本都是异性結合子），則《 =如= 0, 

2" = 1， p ^ =丄. （b) 和型的双亲具有同样的比数， 
2 

貝 (1 « = «/ — — ." 二0 ， 而且 p ~ g ~ — • ( c ) 最后，« = «/ = — ’ 
2 2 4 

2 c / =丄和 p y == 丄. 在这二种情形中，儿輩所对应的 《i =—， 
2 2 4 

1 - 1 — 1 

l, V\ — ―― - ? tt/\ —— 

2 4 

为了更好地了解 （5.2) 的意义，赴我們固定遺传因子的頻率 
P 和 g (p + q ~\ ) 来考虑全部遺传型的頻率《，2〃，似的系統， 
其中《 + p , r +沙= ?. 对第一代子孙来說，一切都导出与 
(5.2) 相同的槪率，在屯們之中，有下述的特殊 分布： 

« = p 2 , 2 v = 2 pq , tv = q 2 . (5.3) 

如果初始的那一代的頻率《，〃，浓具有上述特殊关系 （5.3) —— 
如象例 （ c ) 一样，那么 便有： 第一代子孙的遺传型的槪率为«1=«, 

m , 的 = «/. 因此，我們称形如 (5.3) 的遺传型的分 布是平 
稳的.对每一个比例？ W 来說，都对应一个平稳的分布，或者均 
势. 

方程 （5.2) 給出了一个随机选取的第二代个体的遺传型的分 
布.在一个大的总体里面，我們期望遺传型的眞实的頻率接近于 
理論分布 1 \无論父輩的分布《:2〃：《>为何，方程 (5.2) 定义了一个 


0 S 則，我們的槪率模型就 S 有任何实际意义了.大数定律与中心极限定理給了 
这个#实以精确的搐述，它使我們能够怙計随机起伏的影响. 
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平稳分布，其中遺传因子 j 与分別以頻率 «1 + ^1 = « + ^ = ? 
与"〖+叫= " + w 9出現[参閱 （5.1)]. 換句話說，如果現察 
到的頻率与計算出的槪率一致，則第一代子孙将具有平稳的遺传 
型分布，而且其后代永远具有这一分布.实际上，偏差会覌察得到, 
但是在大总体中我們可 以說： 无論父輩这个总体中的結构如何， 
随机交配所产生的下一代将漸近地具有不变的遺传因子頻率的平 
稳遺传型分布.从第二代起，沒有有系統的变化的傾向，第一代子 
孙就达到稳定的状态.这首先被哈代 U ( G . H . Hardy ) 所注意到， 
因此他解决了在孟德尔定律中假定的难点.特別地，由此推出，在 
随机交配的条 件下， 三种遺传型的頻率具有比例 p ^- lpqW . 这反 
过来又可以用来检驗随机交配这一假設. 

哈代也指出了，必須对“漸近” 一詞加以注意.甚至对平稳分 
布来說，我們都可以期望从一代到下一代会发生小的变化.这就 
使得我們作如下的設想.从任何一个父輩的总体开始，用随机交 
配就建立了下一代中的平稳分布 (5.3). 对于一个平稳分布来說， 
都沒有任何种类的系親改变的傾向.然而，随机起伏会一代一代 
地改变遺传因子的頻率，因此遺传結构会慢慢地改动.不存在一 
种力量来专門去恢复原始的頻率.相反，我們的簡化模型导出下 
述結論（參看原书第+五章例 （2.0): 对一个有限总体来說，一 
个遺传因子最終将要死掉，因此，这个总体最后将属于或如 
中的某一个类型.实际上这幷不一•定会发生，因为新的遺传因子 
的产生依賴于变异、选择和其屯許多影响.要硏究它，就需要更精 
細的数学工具(馬尔科夫鏈，扩散理論). 

哈代的定理經常被解释为永远可以达到严格的稳定性.通常 
犯的錯誤是相信大数定律的作用象是賦与寻求重返原始状态的記 
性的一种力量，而很多錯誤的結論也是由此假設而导出的. C 这里 


I)参閱 [34], 如果先引用一下第九章和第十五章的术語，我們可以把这一情抚搭 
述如下.第《代的三个遺传型的頻率是三个随机变量，其期望値由 (5.2) 所給 
出，它不依轘于它們的眞实値从一代到下一代将要发生变化，它构成一个馬 
尔科夫过程. • 
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所考虑的生物过程是一类重要的馬尔科与过程，它将在原书第+ 
五章詳細地討論 .） 注意： 哈代的定律不能应用到具有两对遺传因 
子（例如眼睛的顏色和习慣用左手）9个遺传型 AABB , AABb , 
• • • , aabb 的分布中去.这仍然有平稳分布的傾向，但是在第一 
代中均势不能达到（参看問題 31). 

*6 .伴性性状 

在前一节的导言中曾經說及遺传因子在染色体上.它們都是 
成对地出現，而传递却是单个地，因此，在染色体上的全部遺传因 
子成柱状結合\所以，我們的遺传因子的遺传方案仍然可以应用 
到作为单位的染色体上去.性別决定于两个染色体，阴性是 XX ， 
阳性是 xy . 母亲一定传給一个 a : 染色体，而后代的性別决定于 
父亲传給他(她)的那一个染色体.因此产生同等数目的阳性和阴 
性配子.男孩和女孩出生率之差可以用先天的遺传物的偶然偏差 
来解释. ' 

我們曾經 說过： 遺传因子和染色体都是成对出現的.但是， 
也有例外的情形，那就是当遺传因子处于 x 染色体上而 y 染色体 
上沒有对应的遺传因子的时候.阴性有两个 x 染色体，因此有两 
对这样的 x 型的联結的遺传 因子; 然而在阳性中， x 遺传因子单个 
出現.两个伴性的遺饩因子会引起色窗和出血素貭.对于屯們之 
中每一个来說，阴性还可以分成三个遺传型 Aa , aa , 但是却 
只有一个遺传因子，而阳性只有两个遺传 型丄和 A 注意： 儿子 
經常是具有父亲的 Y 染色体，因此，伴性性状不可能由父亲传給儿 
子.然而卞可以通过父亲传給女儿，再由女儿传給孙子. 

現在我們把前一节的分析进行推广.仍然假定随机交配，幷 
且假定在阴性总体中遺传型 AA , Aa , aa 的頻率分別为《，2〃， 
如前面一样,我們令 p = u + v,q = t ^+ w . 阳性的两个遺传型 
J 与《的頻率分別以 〆 和 〆 表示（ 〆 + q ' = 1). 于是 P 和 〆 分 

0这情形由于染色体的偶然破裂和重新結合而稍复杂些（参 閱第二 章問繮 
( 10 . 12 )). 
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別为遣传因 + J 在阴性总体与阳性总体中的頻率.一个阴性后代 
的遺传型为 AA , Aa , aa 的槪率分別以的，2^,叫 表之； 阳性的 
型/ 和型《的类似的槪率以 〆 和 3 ;表之.因为一个阳性后代从 
其母亲那里得到 X 染色体，所以 

p [ = p , 4 \ = < j . C 6 - 1 ) 


对三个阴性的遺传型来說，如第5节一样，我們发現 
"1 = PP, = pci + QP - 1^1 = 叫 , . 

因此 


( 6 . 2 ) 


Pi = u x + vi ^ — ip + p') , 
2 

9i = ^1 + m = ~ C<7 + 〆）• 
2 


(6.3) 


我們可以把这三个公式作如下的解释.在阳性的后代中，属 
千坻系的遺传因子和《分別近似地以頻率 P 和<?而出現；而在 
阴性的后代中，遺传因子的頻率近似地为外和奶，或者說在父系 
与母系中的这些遺传因子的頻率近似为巧与奶.我們发現遺传 
因子的頻率有趋-于相等的趋势.事实上，从 （6.1) 和 (6.3) 我們得 
到 

pi — pi = — (? — p'), — ?i = — (? — ^). (6.4) 

2 2 

这意味着随机交配使下一代的阴性与阳性的遺传因子的頻率之差 
近似地将要減少一半.然而，它不能使这个差变为0,使之更加減 
少的趋势是存在的.与哈代的定律比較，在一代以后这里沒有平 
稳的情形.我們可以追究由一代到一代的变化的系統部分而忽略 
随机起伏，幷驗証理論槪率（6.2> 和 (6.3) 与第一代子孙的对应的 
实际頻率一致对第二代来說，用类似的推导我們可以得到 

pz = — ipi + = + ~r P > 

2 4 4 


1) 如果用第5节脚注中所引迸的术語，我們可以把与〜解释为第”次阴性子 
孙中遣传因子的期错値.如果这样解释的話，关于_/>« 和办 的公式就不再是漸 
近式而是精确的等式了. 
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(gi + 


3 . 1 / 

— q **r — q . 

4 4 


当然， h = 朽， S = q u 第”代阴性子孙中槪率 N 和办的一般 
表达通过几步推导就可以得到.令 

« =丄 (2 p + 〆 ），/3 = —{ 2 q H - q r ), (6.6) 

3 3 


(注意 a-h p = 1.) 于是 


p n ^ x + ^ a + (― _ g 二 f 

2 3 - 2 n 


^ n—X + — 1 


) B + (― 1) 




(6.7) 


3 _ 2 ” 


而 A = Pn ^ q n = 分” 一 u 因此 

pn 一 a. p„-* a, q n 一玲， q n P. (6.8) 

正如 (6.2) 所給出的一样，在阴性总体中遺传型的頻率为 

Pn —1 夕 w— 1 ， n p ， — \(Jrt —1 + Qn—\Pn —1 ， 

= q n -\q'n-u (6.9) 

因此 

«„ —*■ a 2 , 2 f n — 2« j 3， u /„ —> (6.10) 

这些公式說明了，当一代一代传下去的时候，有一个很強的系 
統趋势，使之最后趋于这样一个 情现： 遺传型^和《在阳性中出 
現的頻率分別为《和)8,而阴性的遺传型 AA , Aa ， aa 分別具有槪 
率《 2 , 2嘁， P 2 . 由 (6.7) 看出，其收斂的速度是很快的.实际上， 
三四代以后就会达到均势.确实，上述的变化的随机起伏是很小 
的，然而后者說明了主导的系統趋势. 

我們的主要結 論是： 在随机交配下，我們可以期望在阳性中 
的伴性的遺传型 W 和 a ; 在阴性中的遺传型 j /， Aa , au 分別漸近 
地以頻率 a ， /3, a 7 , 2«3, ]3 3 而发生，其中 a + P = 1. 

应用.許多伴性遺传因子（如色窗）都是隐性的幷且会引起 
缺陷.令《就是这样的一个遺传因子.于是所有的阳性的《和所 
有的阴性的 aa 都会显示出缺陷. / la 型的阴性生物可以把缺陷 
传給她們的后代，彳旦却不影响她們自己.因此，我們可以期望，隐 
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性的伴性缺陷发生在阳性生物中的頻率为《，而发生在阴性生物 
中的頻率为 V . 如果100个男人中有一个色富的話，那么在10,000 
个女人中才会有一个色肓. 


*7 .选 择 


作为选择的影响的一个典型例子，我們将要硏究个体不可 
能重迭的情形.当遺传因子《是隐性的和致死的时候就会出現这 
种情形，因此，个体似出生了但是不能生存.若用人工培育去千 
涉或阻止 个体仰 之交配时就会出現另外一种情形. 

假定在个体与 Za 之間进行随机交配，但是不与型进 
行交配.令总体中 AA , Aa , 似型的遺传型出現的頻率分別为《， 
2 t /, w . 于是其亲本对应的頻率为 

= —-—, 2 v * = lv ， w * = 0. (7.1) 

1 • w 1 — w 

我們可以仿照第 5 节一样去进行推导，不过必須以 （7.1) 中的 
三个量分別代替《，因此， （5.1) 被 

P = 子土二， q = — ^— (7.2) 

1 — tv 1 — W 


听代替.第一代子孙中那三个遺传型的槪率仍然由 (5.2) 或者說 
= p 2 , 2v\ — 2 pq , uj\ = 所給出 ■ 

与前面一样，为了硏究从一代到一代的系統变化，我們用叫， 
〜 M 分別替代《，〃，心从而得到第二代的对应的槪率《 2 ，〜 
w 2 , 等等.一般地，由 （7.2) 我們得到 


Pn 


+ Vn 


1 一 


(in 


V n 


w n+l Pn, = 2p n <J n 9 W^n+1 === ^ln* 

比較 (7.3) 和 (7.4) 得到 


Pn+l 


Pn 


“n+1 + "n+1 _ _ _ _ 

1 — ^n+1 1 — ^ 1 + % 


(7.3) 

(7.4) 

(7.5) 


和 
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flrAi 




1 — W n ^\ 


1 + qn 


从 (7.6) 我們可以精确地算出办来.事实上 


(7.(5) 


由此相継地得到 

- ―1 ~1*~ - 
q \ ( 


^ n+l 


1 + 




—= 2 H - — , — == 3 H - —, * 

兮 2 ^ ^3 ^ 


或者 


<ln 


(In 


q 


1 + wy 


e^n+l 


(r 


4 - qn ^ 


(7.7) 


(7.8) 

(7.9) 


我們发現不繁殖的遺传型逐漸被淘汰，但是这个过程是很慢的. 
对分= 0.1 来說，到第+代才使遺传因子《的頻率減小一半，使 


aa 型的頻率近似地減为(如果《是伴性的，則如問題29所証 

4 

明的，其被消除的速度是很快的，而对一般的选择方案来說，請參 
看問題 30.) 


8.問 題 

1 .擲三个骰子.若已知沒有两面相同，求至少有一个么点的槪率. 

2 •擲十个骰子.已知其中至少有一个么点出現，求有两个以上的么点出 
現的槪率 

3-^. 在桥牌游戏中，西家沒有爱司.問他的合作者（东家 ）0) 浚 
有爱司 /( b ) 有两个或两个以上的爱司的槪率是多少？用直接的推理驗証所 
得的結果. 

設南，北两家共有10张王牌（王牌是一种指定花色的牌 ）.0) 
試求另 A 〗张王牌集中在同一家（东家或西家）的槪率 . 0) 若已知其余3 

张王牌中有--张老开，試求他是“孤家寡人”(意卽他只有一张老开，而其余两 
张王牌在他的合作者手中）的槪率. 

5 •用例 （2. b ) 中的条件槪率的槪念討論第 二章淨 j (7. b ) 中的钥匙問題. 

6 .在一个蜞絲釘制造工厂里，有三个机器 （ B , C , 它們的产量分別占 
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总产量的 25%, 35%, 40%, 而它們的产品的废品令:分別为 5%, 4%, 2% ， 
今从产品中任意取出一个螺絲釘，而发現它是废品.求这螺絲釘是由机器 /( 
或 S 或 C 造出的槪率. 

7 •設 100 个男人中有 5 个色盲者，而 10,000 个女人中有 25 个色盲者. 
今从人羣中任取一人，幷发現他是色盲.求此人是男性的槪率（假設人羣中 
男女的人数是相同的）. 

8.7 个球随机地放入 7 个盒;各种排列的槪率在第二章第 5 节的表 1 中 
都巳列出.应用此表, 驗証： 給定两个盒是盎的条件下有一个 盒三次 地被占 
有的槪率为 1/4, 精确到 5 位小数.証明 1/4 就是正确的答案. 

9.擲一顆骰子，一直到出現么点为止.假定第一次沒擲出么点，問需要 
擲次数多于3 才停止 的槪率为何？ 

10( 綏上) . 假定所擲之次数》为偶数.問《 = 2的槪率是多少？ 

II 15 -設一个家庭恰有》个小孩的槪率 h 是 «?", »> l,Po = 1 - 
«P (1 + f + 〆 + • • :)，丼設《个小孩的所有可能的性別分布是等槪的，証 
明当 k>l 时，一个家庭恰有々个男孩的槪率是2«^/<2 - P) k+1 . 

12( 績上) ， 己知家庭中至少有一男孩，求此家庭至少有两男孩的槪率. 

13 .骰子 d 具有四面紅两面白，骰子 S 具有两面紅四面白.扔一个錢芾， 
如果出現 TE 面，則継續擲骰子4如果出現反面，則擲骰子 B . 0) 証明在任 
何一次拋擲中，出現紅的槪率是 1/2. ( b ) 如果前两次結果是紅的，問第三次 
榔出紅的槪率是多少？ （0 如果前面《次出現紅的，問能擲殺子 J 的槪率是 
多少？ （ d ) 罐子模型是否和这个游戏等价？ 

14 .在例子 (2. a ) 中，令为获胜者在第《次試驗获胜的槪率，〜和 2 „ 

分別为輸家和等待者在第》次試驗获脞的槪率 .（0 証明 

1,1 1 1 ,, 

x n — — 4* — y / j+l ， -- z n+l ， z n — — **»+】• C */ 

( b ) 用直接的簡单推理証明，实貭上 〜= y „ == y y z „ = z 不依賴于 w . ( c ) 
証明 《 胜这一局的槪率为 5/14 (用第一章問題 5 的推理）. ( d ) 証明;= 

Y ? =寻是 （*) 的唯一的有界解. 

15•設事件七，…，毛独立，且 K a k ) ==以，試求沒有一个 

1,2, •••，》)发生的槪率 


1) 根据 A . J . Lotka ， 当 ? = 0.7353 时，美国家庭的統計是滿足我們的假設的. 
参看[35】. 
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1 〆 覆上).証明 pcrin . 

17( 續上).由彭弗雷尼不等式（第四章 （5.7)) 推出： 在事件 
中有4个以上同时发生的槪率小于 （Pi + ••• + h)V々L 
18. »禾.1]平寧罕 ,^J(2.c). 若巳知第二次所取出的球是黑的，求第 
一次所取 W 的'球\^是'黑'的-率. 

用数学归納法 証明： 无論是哪一次試 

:驗，黑球 0 . 

20(辍上）.用归納法証明，对任何 m <»， 第™次与第 n 次所取出的球 
是黑，黑或黑，紅的槪率分別为 

_ b {h + e ) _ _ br _ 

(* + r) (6 + r + tr) 5 {b + r){b + r 十 r) ’ 

幷把此結果推广到多于两次取球的情形. 

21. urn ®. 設尖 s 表示杠球或是黑球 (卽 也有四 
种可能的 kk£; 黑紅；黑黑）.証明：已知第《次出現/后 

苐》次出現$的槪率，是等于己知第》次出現 s 后第~次出現 j 的 槪率. _ 
22 •在波利亚樓型中，設以(《) 是前” 次敢球中出現《个黑球的槪率，証 
明下面的递推关系式 

怒(” + 0 = + 以 

n + r + nc b ^ r nc 

其中 P-l(») 解释为零.应用这关系式，卽可得到 (2.3) 的一个新証明方法. 

23 -筚 呼平兮 •市.在( 2 . 4) 中令 

± = p , — r — = h -_^- = r . 

b •{- r b r h r 

証明 

Pn. ,n - ; - ， n n \ + 打 2 ， 

(-7)» 

对任何常数(不一定是有理数） p > o , 4 >0, r > o ^ 都有意义（其中 p + ^i = 
1) .驗証 和 

2( v) ?l， -° = l2) - 

V«s 0 

因此方程 （8.2) 濟定了整数0, 1 ,…,” t 的一个槪率分布，卽波利亚分布. 

1) 原书为 r > - 1是錯的——校者注. 

2) 原书为 f； = 1是錯的——校者注. 


( 8 . 1 ) 


( 8 . 2 ) 
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24 •淳，罕兮肀 哼®® 序萃 • 如果 n — oo , r -^ o , r—o 俚得 《 p — 又， 
nr — p - 1 ， 則 

驗証这一关系，幷証明对于固定的； i 和 p 来說，右边項加起来为1 • (右边是 
所謂負二項分布;参看第六章第8节和第六章問題 37.) 

25.用条件槪率来解释第二章 （11.8). 


在生物学中的应用 

26. 在随机交配的条件下，总体中属于遺传型的个体小于总数的 

1 / 2 . 

27. 把第5节中的結果推广到下述情 形去： 每一个遺传因子具有 

^中的任一形式，因此有 C 言 D 种遺传型而不是三种遺传型（复 
等位基因）. 

28. ^^®. 从一个总体中随机地选取二个亲本，假設这个总体中遺 
传型 AA ^ Aa , 出現的頻率分別为《，2 卜如. 这个过程一直在他們的后代 
中重复地进行.求出第一代第二代第三代子孙的亲本都是属于的槪率 
[参看第十五章例 (2.1) 及第十六章例 （4. b )]. 

29 •寧 寧. 令 o 为一个隐性的伴性遺传因子，假定在一个选择过程中与 
阳性的《交配是不可能的.如果在阴性中遺传型 以，心，时 出現的頻率分 
刖为《， 2 。，》，試証：对第一代阴性子孙来說， s<i = « + v , 2^1 = ^ + w , 

tv \ = 0 , 因此 #>i = p + jg ， 们=这就是說，在阴性中，遺传因子* 

減少了 一半. 

30 .第7节中的选择問題可以推广到这样一种情况：假定只有郎类的 
分数可以除去.証明 

— “十 P 

p = T :~^ T ， 

更一般地， （7.3) 被 

^ . — Pn 

〜 +l 一 nr 


i ) 原书有銪，它只写«，而 a 有这个因子——校者注. 
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-( 1 一 X)w 
1 — Xw * 


^ n+l = 


1 - 




所代替.（这些方程的-•般解似乎是不知道的 .） 

31. 同时考虑两对分別具有可能形式(3, *) 的遺传因子.每一 
个々传給他的后代以这两点中各一个，幷假定达四个可能中的毎一种都具有 
槪率 1/4. (当遺传因子在分离的染色体上的时候就是这种情形，否則它們 
之間有很强的依賴性 J 有9种遺传型，我們假定它們在父輩总体中的頻率分 
別为 UaaBB , VaaBB , U AAbt , Uaabb , 2 U AaBB , 2 U A 邮， 2 UaAB b , 2 t / a aB 6， Wa xBb . 
令 PAB = V Aj ibb + VAABb + AaBB + ^AaBb ■, PAi = ^AAbb + VAaib + U AABb 

+ U AaB i , p iB = UaaBS + UaaBb + U^aBB + ^ AaBb , Pab — + VAaii + 

UaaBb + U AaBi . 計算第一代子孙的对应的量.对它来說我們 証明： = 
PAB — <5, PaI — PAh + <5, fi'i = PaB + <5, Po * = Po 4 — 其中= PABPab 
— pAtPaB . 平稳分布为 -2 S = p Ab + 2 ff , 等等.（注 意： 哈代的定律 
不能应用；由一代到下一代其結构会发生交化 .） 

32. 假定在某总体中遺传型的頻率为« = p 2 , 2 v = 2 pq , 如=兮 2 .給 
定一个具有心型遺传型的人，他兄弟也具有同样的遺传型的槪率为 
( l + M )/2. 

注意 1 \ 下面这些問題都是建立在家族关系上的，幷且也給出了亲属 
关系等級槪念的一种直覌意义.每一个問題都是前一个問題的継績.仍旧 
假定随机交配，幷沿用第5节的符号.我們这里考虑的是一类特殊的馬氏 
鏈(参看 原:书 第十五章).矩陣代数可以簡化书写. 

33. 分別以数字1, 2, 3来代替遺传型 AA , Aa , aa , 幷令 />/* (;, k = V , 
2, 3) 为已知其父亲（或母亲）的遺传型为 i 的条件下其后代的遺传型为々的 
条件槪率.計算这9个槪率假定其它的父輩的遺传型为1, 2, 3的槪 
率分別为？^ 2 pq , q 2 , 

34. 証明在己知其-•特定的子女的遺传型为的条件下，父亲的遺传型 
为々的条件槪率也是 P ,_ t . 

35. 証 明： 在已知其孙子（祖父）的遺传型为 i 的条件下,其祖父（孙 
的遺传型为《的条伴槪率为 

p !** = Pi \ P \ k . + 十 PiiPik . 

(矩陣 ( P ', V ) 是矩陣 ( P /4) 的平方 .） 


1) 第一版在此处有一•錯誤，那里用“兄弟”（同父同母）一詞代替丫此处的“异父或 
异母兄弟”.李 （ c . c . Li ) 和路易斯•沙克斯 （Louis Sacks ) 指出了 这一銪 
'誤，丼給出了正确的 公式. 用随机炬陣导出了联昏分布及亲厲之間的关系.参 
眷 Biometrika , 40 (1954), 347— 360. 
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36 . 証 明： 在已知某人的异父（或异母）弟兄属于遺传型 》• 的条件下，此 
人属于遺传型々的条件槪率也是 

37. 証 明： 在已知某人的祖父（或孙子 ；) 属于遺传型；的条件下，此人属 
于遺 传型々 的条件槪率为 


P?k = P?lP\k. + P ( nP2K + PnP3k = P ； lP?k + P»2Pz* + P ； 3p?t. 

(矩陣是矩陣 ( Pi 0 的三次方.这神手續給出了亲属关系的等級槪念 
以一种明显的意义 .） 

38 .更一般地，我們定义 为： 在已知某人属于遺传型；的条件下，其 
某一个 第 „代子孙属于遺传型々的条件槪率.試用归納法証明： Pf 是下 
面这一个矩陣的元素 


" 2+ 吳 

2 押 + 

— p) 
2 W_1 

? 2 

—分 2 

2"- 1 

广 2 +心 一 P) 

2pq + 

1 — Apq 


• 4 {p — 

2 n 

2 n 

2 H 

2 «-1 

2pq + 

P{P — 

2 »-1 


+ 抑 

卞 2 tt_1 


(这 表明： 一代一代传下去以后，祖先对子孙的影响逐漸下降,其比例因子为 

1 / 2 .) 

39. 再考虑問題36,不过要把“异父(或异母）兄弟”代之以“亲兄弟”.征 
明：达时对应的矩陣为 

/ 4*(1 + p) 2 —?(i + pq ) 

+ i ( 1 -1- pq ) 

\ 丄 P 2 丄 p(l 十 <y) 

^ 2 

40 . 証明叔侄之間的亲戚关系的等級与祖父和孙子之間的亲戚关系的等 
級是一样的. 


\ q2 

T 9(1 + 9) 
+ ( …) 2 
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第六章二項分布与普阿松分布 

1. 伯努利試驗序列 1 > 

在重复的独立試驗中，如果每次試驗仅有两个可能結果，而且 
其相应的漑率在每次試驗中都是相同的，則称这一串重复的独立 
試驗是伯努利試驗序列.我們經常以?表示两个相应的槪率， 
幷将具有槪率 P 的可能結果称为“成功”，記以\而另一个可能結 
果則称为“失敗”，記以显然， P 与？应該是非負的，幷有 

p + q = 1, (1.1) 

每次試 驗所对应的样本空間是由两个样本点 S 与 F 組成的， 
而《永伯努利試驗的样本空間則含有2»个样本点，卞就是由”个 
符号 S 与 F 所組成的排列.每个排列表示联合試驗中的一个可能 
結果.因为試驗是独立的，所以它們的槪率是等于各个槪率的乘 
积.換言之，每一給定排列的槪率可由下面的方法得出，在排列中 
用 P . 分別代替 S , F 后，所得的一个乘积便是所要的槪率，因此 
P {5^ F 6' F ... fF 6'} = ppqpq .. . qqp . 

例. 伯努利試驗序列的一个最熟悉的例子是連續扔一个均 

勻的錢币，此时 = K 如果錢币是不均勻的，且我們假設 

2 

連續扔錢币的試驗是独立的，則我們也得到了伯努利試驗序列的 
模型， f 过此时成功的槪率 P 可以是任何数値' 每次都从一个包 
含有个紅球6个黑球的罐子中重复地随机取球，这种取球代表 
一-串具有 P = r /( r 十的伯努利試驗.有时，一个試驗会有好 


1) James Bernoulli (1654 — 1705), 他的主要工作 “Ars confcctandi ” 于 L 7 H 年 
出版. 

2) 这里应該說是 U 与1之間的任意数埴——譯者注. 
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几个可能的結果，但我們幷不注意各个結果的区別，而是把这些結 
果簡单地区分为两粗 J 或非乂例如，擲一个均勻的骰子，則么点 
出現 （ S ) 与非么点出現 （ F ) 的区別便导至一个伯努利試驗，此时 

P = 偶数点出現与奇数点出現的区別也导至一个成功槪率 

6 

p = i 的伯努利試驗.若骰子是不均勻的，則重复擲骰子也組成 
2 

一串伯努利試驗，但是成功的槪率可有各种不同的数値.扑克 
中的最大同花或擲两个般子都出么点都可以用成功来表示，而所 
有其他的可能結果的出現用失敗表示，則我們有成功槪率分別为 

p = 1/64<3,740与 p =丄的伯努利試驗.在統計应用中常常把 

36 

問題化为这神类型来处理.例如，在大量制造垫螺釘的小鉄片时， 
鉄片的厚度可有各种不同的数値,但是，在产品检查中，我們往往 
把鉄片的厚度分为两类，卽如果厚度在預先規定的范围內，則称为 
合格 (5)； 反之則称为不合格 ( F ). 

伯努利試驗序列是一个理論的模型，幷且，用它来描述某一指 
定的实际試驗是否合适仅能由經驗来判断.关于連續扔一个錢币 
是伯努利模型的知識是由实驗的証据推导出来的.街上的行人和 
哲学家馬伯 1 > ( K . Marbe ) 都相信在連續出現 I 7 次的“正面”后， 
“反面”的出現将是更槪然的.这个主张幷不牵涉到錢币完善不 
完善的問題，而是把記忆力付与了自然界，也就是（用我們的語言 
来說）否孰了逐次試驗的独立性.馬伯的理論不能用邏輯来驳倒， 
但是，由于它缺乏經驗的支持，入們还是拒絕接受它. 

在抽样的实践，工业的貭量控制等等中，伯努利試驗序刘的模 
型提供了一个理想的标准，虽然这标准从来不能完全达到.在上 
面所耕的垫螺釘的鉄片制造的例中，有許多理由說明为什么产品 
不能形成伯努利模型.例如，由于机器的必然起的变化使得槪率 
不能保持为常数.机器的运轉有慣性的傾向，因此，同类偏差的长 


1) 卷看[%]，关于馬伯的理論，有許多批評的 丈章. 
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連眞的出現，是要比各夕:动作純为独立的情祝下更为 槪然的 •但 
是，从貭量控制的观点来看，我們愿意生产过程符合一个伯努利模 
型，而一个重要的发現是，在一定范围之內，生产过程是可以达到 
这个要求的.这样一来，連續控制的目的，就是要及早地发 現显著 
地与理想模型的偏离，幷利用它作为就要发生毛病的警报. 

2. 二項分布 

在《次伯努利試驗中，我們往往只关心成功的总次数而不計 
較成功的排列次序.由于成功的总次数可能是0，1， •…，〜因 
此，我們的第一个問題是求出它們相应的槪率.但在次試驗里 
有4次成功，《 —々次失敗”的出現可以有許多的方式，其方式的 
个数就等于4个文字 S 在" 个位置上的所有可能分配法，換言之， 

这一事件共含有个样本点，幷且， 由 定义，每点的槪率都是 

p ^ q n ~\ 于是，我們証明了下面的定理. 

定理 . 在成功槪率为 P ， 失敗槪率为 q = 1 — 夕的 》次伯努 
利試驗中，有々次成功，”一々次失敗 (0 ^ ^ 的槪率 
P ) ^ 

n , p ) = PV - *. (2- 1 ) 

特別，未成功的槪率是/，而至少有一次成功 1 的漑率是1 一 

我們考虑 P 为常数，而且令次試驗的成功 次数； 則 
n , p ~) = P { S „ =々}.用一般的术語来說， S „ 是随机变量，函 
数 (2.1) 是这个随机变量的“分 布”； 我們将称这个分布为二項分 
布.因为 （2.1) 是 （p + ?)” 的二項展开式中昀第4項 13 , 所以我們 
有“二項”两字的名称.这个解释还指出来 b {0-, n , p ') + KU »， P ) 
十 • . . + i ?( n ; n , p ) = (p + q) n = 1. 这也正是槪率的槪念所需 
要的.二項分布有表可查 1 2) . 

1) 此处有錯,应为第々+ 1項——譯者注. 

2) 对《矣50,参看 [37]; 对 50< n < UI 0 参看〖38]:对更大的区域，則参看 [39]. 
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例. G ) ( Weldon )— 呼于零 孝学. 設所进行的試 

驗是挪12个骰^ •/ 幷 k 出 現点数如果骰 子是完 

善的，則成功的槪率 P = +. 于是，成功次数的槪率将由二項分 

^ b ( k \ 12, 来表达.表 1 給出了达些槪率以及在 26,306 次 

的实际实驗中所得到的相应的观察平均頻率.迖两者的相合‘性看 
起来似乎是不鍺的.但是，对于如此大量的数据来說，符合程度其 
实是很不够的.統計学家常常用; f 2 准則来判断拟合的程虔.根据 
这个准則，对于均勻的骰子而言，象威尔頓观察到的那样大的偏差 
只有万分之一的发生槪率.因此，我們有理由假設殺子是有偏的. 
当成功的槪率改为？ = 0.3377 时，最符合于我們的覌察結果 [wl . 


表 ]. 威尔頓擲骰子記录表 


k 

HA; 12, l/j) 

观察的頻率 

办 （々；12,0.3377) 

0 

0.007 

707 

0.007 

033 

0.007 

123 

1 1 

.046 

244 1 

.043 

678 

.043 

584 

2 

,127 

171 

.124 

116 

,122 

225 


.211 

952 

.208 

127 

.207 

736 

4 ! 

.238 

446 

*232 

418 

.238 

324 

5 

! 

.190 

75; 

I 

.197 

445 

.194 

429 

1 

6 '| 

. m 

j 

275 

.115 

589 

, U 5 

660 

7 

.047 

6 S 9 

. .050 

597 

.050 

549 


.014 

903 

.015 

320 

.016 

109 

9 

.im 

312 

1 .003 

991 

.003 

650 

W 

.000 

497 

.000 

532 

.000 

558 

n 

.000 

045 

1 .000 

152 

.000 

052 

12 

.000 

002 

1 .000 

000 

.000 

002 


( b ) 在第四章第4节当我們考虑牌的猜測問題时，曾經遇到 
过二項分布，那里的表3中心諸列列出了 = 3, 4, 5, 6, 10和 

p =- 时分布中的各項.在第二章 （4. c ) 的占位問題中，我們找 
n 

出了公式（4.5)，它是二項分布的另一个特殊情形. 

( c ) 如果成功的槪率是0.01，問需要有多少次試驗才能使得 
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至少出現一次成功的槪率是 1/2 或更大？此时，我們是求最小的 

n ， 使得 1— (0.99)" > 丄，或是 一 》log (0.99)> log 2,因此 

2 

( d ) 雙 零带寧明寧.假定有«= 10个工人間歇性的使用电 
力，我們感兴^的是怙計所需要的总負荷.作为一种粗糖的近似， 
我們設想在任何一个給定时刻每一个工人以同样的槪率 P 需要一 
个单位电力.如果他們是独立地进行工作，則恰有々个工人同时 
需要电能的槪率是 bik % n , p ). 如果一个工人在一小时內平均有 
12分钟需要电能，則我們令 p = ~. 于是在同时有七个或者七 

个以上的工人需要电能的槪率为 K 7； 10. 0.2) + ••• + K 10； 
10, 0.2) = 0.0008643584. 換句話說，如果最多只能供应6个单 
位电力，則起过貪荷的槪率为 0.00086 •…， 卽是1157分钟內約有 
一分鉀，亦卽約20个工作时中可能有一分鉀超过負荷.八个或八 
个以上的工人同时需要电能的槪率仅仅为 0.0000779264, 卽比上 
述槪率的1/11还要小. 

( e ) 血淸或防疫检驗 l « ] . 假定某种疾病在牲畜中传染的正規 

• •••••• 

比例是百分之二+五.为了检驗一种新发現的血淸，我們 把”个 
健康的牲畜都注射这种血淸.我們如何用数字来表示这一試驗的 
結果呢？如果这种血淸完全不起作用，則这《个被注射的牲畜中 
恰有々个不威染这种疾病的槪率为 6(4; »， 0.75). 当々 = » = 
10时，这个槪率大約为0.056,而当々= n = 12时，这个槪率只有 
0.032. 因此，如果10个或者12个牲畜中沒有一个感染这种疾 
病，那么我們就可以用它指明这种血淸是有效的，虽然这还不能作 
为最后的論断. 注意： 如果不注射血淸，17个牲畜中至多只有一 
个感染这种疾病的槪率大約为 0.0501. 因此，17个被注射_牲畜 
中只有一个威染病比10个被注射的牲畜中沒有一个威染病更能 
說明这种血淸有效.当》= 23时，至多有两个牲畜感染疾病的槪 
率大約为 0.0492, 因此，23个牲畜中只有两个威染疾病又比 L 7 个 
中只有—个威染疾病， 10 个中沒有一个感染病更能說明血淸之有 
效性. 


• 144 • 



( f ) 琴了呀赛守學學. 假定” 个人服用某种葯后量他們的 
血压，不量他們的血压.因此，得到两組測量結果&， 
， • • ，&和>••，<.如果& < ¥，則我們說第次試驗的結 
果是成功，如果々 > 則說第/次試驗的結果是失敗.（为了簡 
单起見，我們假定沒有两个測量的結果相等. ） 如果这种葯沒有效 

果，則我們的观察对应着具有槪率^ 的„次伯努利試驗，成 

2 

功的次数很多，就可以作为这神葯是有效的一个証据. 


3. 中心項及尾項 


从 （2.1) 我們看到 

n , p ) — (» — 々+ l)p 一 丄 [_ (w + l)p —— k . (31) 
〆 々 —l ； n, p) \q \q • 

因此，当々 < (n + 时， 〆 々； w ， p ) 比 〆 々一 1; ra ， p ) 大；当 
々: > (_w + l)p 时， b 、\' n ， p ) 比 6(々 一 1； n , pM 、， 如果 （》+ l)p 
= m 是整数，則 b { m \ n , p } = b{m — 1; n , p ), 恰巧存在一个 
整数抓滿足 ' 

(« + l)f> — 1 < w ^ (rt + \. )p, (3.2) 

因此我們有 

定理 1. 当々由0变到》时， 》， p ) 最初单調增加，而 
后单調下降，而且在 w 达到它的最大値，但当 /» = (» + 1) ? 
时， b{m — 1; », p ) = b { m ; n , p ). 

我們称 bim % «, p) 为中心項. 历通常 称为“成功的最大槪然 
次数”，但是，必須了解 ，当” 很大时，所有的 b ( Jr , n ， P ) 都很小. 
把一个均勻的錢币扔100次，正面出現的最大概然次数是50,但 
黾正面出現50次的槪率比 0.08 还小.在下一章里，我們将要証 
明 b{m \ n, p) 近似地等于 {2nnpq')~^ m 

显然， (3.1) 里的比値当々增加时单調下降，因此，当 +J 
时，我們有 

H 次； 》， P) < in — r)p ^ 3) 

〆 々 一 1; « ， p) (r + 1)^" 
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令々= 7" + 1，•…， J " + V , 再把这 V 个不等式相乘，卽得 

b{r + v;n, p) J (« — r)pY ( 

b{r\ n, p) l(r + l)q\ 

当 r > 即时，括号內的分数小于1，因此把它对 y 求和，卽得一个 
公比为— r)p/{r + l)q 的有限几何級数 . 因此，对 r >印，我 
們断言 


+ v; n. p) <： i>( I 


py 


(r + l)<7 


(3.5) 

+ 1 一 (ra + 1 )p 

左边是二項分布的右端的“尾項”，卽是至少成功”次的槪率，把 
同样的計算应用到左端的“尾項”上去，可以証明，对于： < 邮有 


p) < 


匁，户） 


(« 一 .(■ + 1 
(n + 1 — s 


( 3 . 6 ) 


因此，我們証明了 

如果 r > np , 至少成功 r 次的槪率滿足不等武 （3.5) ; 
最多成功 r 次的槪率不等 iTU ). 

〜种証明，参看問題 3 9( a ).] 


4.大数定律 

我們曾經几次地提到过槪率的直覌槪念是基于以下的假定上 
的.如果在》次相同的試驗中， j 发生 V 次，而且令》很大，則 v/n 
将接近于/的槪率显然，一种形式上的数学理論从来不可能与 
現实的生活直接联系起来，但是它至少应該对我們所要解释的現 
象提供理論的描象.因此，我們要求把刚才說的那句不够淸楚的 
話加以精确化，而叙述为定理的形式.为此，我們理解“相同的試 
驗”为成功槪率是 P 的“伯努利試驗如果 S „ 是》次試驗中成功 
的次数，則 S „/» 是成功的平均次数而且接近于現在，我們可以 
很容易給它一个精确的意义.例如，考虑 S „/ n 超过 p + S (其 
中 s > 0是一个任意小但是固定的常数）的槪率.这个槪率就是 
P { S „ > nip + s)j , •它等于 (3.5) 的左边（这时 r 是超过 》(p + s ) 
的最小整数）.因此， （3.5) 蘊含 



P{S„ > n{p + e;] < b{r; n. (4.1) 

nQ -r q 

当 》 增加时，右边的分数保持有界，此外因为对每一个滿足 (《+ i 〉？ 
< 々< r 的々，都有 b(r; n, p ) < n, p) , 这样的 〆 々； n,p~) 大 
約有 》 S 項，所以 —0. 这就推出，当《增加时， P{S„ 
> nip + e)} -* 0 . 应用公式（3.6)，用同样的方法可得 P{S„< 
w(p — e )} — 0,因此，我們有 

P | — — p < s| —»■ 1. (4.2) 

用丈字表示 ，当” 增加时，成功的平均数与 P 的偏差超过預先 
指定的 s 的槪率趋于0 . 这是大数定律的一种形式，幷且它是把 
槪率作为相对頻率的一个度量的直观槪念的基础.对于实际应用 
必需以 (4.2) 左边的漑率的更精确估計来充实；这样一个估計将在 
二項分布的正态逼近中給出[参看第七章例 （3. g )]. 实际上公式 
(4.2) 是第七章問題18的一个簡单的推論. 

結論 （4.2) 是古典的大数 定律. 它的用处是非常有限的，我 
們将要用更精确更有用的強大数定律来代替它（参看第八章第4 
节). 

诖意.常常把許多不能从大数定律推出的事件也訴諸予大 
数定律.如果甲和乙扔一个錢市10,000次，常常这样 希望： 甲領 
先的次数大約为一半.但是，这是不对的.反正弦律（第三章第 5 
节) 指出： 領先次数各半的可能很小.甲傾先的次数小于 2 0的槪率 
比領先次数落在4990和5010之間的槪率大得多.不存在領先期 

間相等的任何傾向.大数定律只 是說: 在大量的不同的扔錢币的游 

<« 

戏中，在任何一个給定的时刻正面領先的頻率近似地为1/2,至于 
在一个固定的游戏中，領先的起伏問題，大数定律什么也沒有說. 

5. 普 | 河松逼近 1 > 

在很多应用問題中，我們常常遇到这样的伯努利試驗，其中， 

1) Simeon D. Poisson (,1/81 —1 S^O). 参看■他 著的书 [42J . 
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相对地說， ”大， P 小，而乘积 

X = np (5.1) 

是大小适中的.在这种情形下，我們采用 Kk -, n ， p ) 的一个近似 
公式是很方便的，这近似式是由普阿松得出的.下面，我們将推导 
这公式.由于 Ko ; 〜 ? ) = (1 - P )% 現将 （ 5 . 1 ) 代人其中，則得 

6(0; n . p ) = ^1 — . (5.2) 


取对数幷且利用泰劳 （Taylor ) 展开式[第二章公式（ 8 .10)],我 
們有 、 2 

log 々(0; n , py — n log ^1 — — — 一 A — - • ’ • ， （5.3) 


因此，对于充分大的 〃，有 

i >{0; n , p ) ^ e ~ k , (5‘4) 

其中符号〜表示漸近相等（在現在这神情形下，屯們相差阶为 
n - 1 的无穷小量）.此外，从 (3.1) 得知： 对任一个固定的々和充分 
大的》都有 

d (/ j ； n , p ) _ A — — l)p ^ A ( 55 ) 

bik — 1: n ， p) kj] k " 

当々 = 1，从 (5.5) 和 (5.4) 我們得出 ^(1; », p ) ^ X e ~ k . 当々= 2, 
我們得到 ^(2； «, P ) ^ wn . 一 般地， 由曲 納法我們得到 

, ^ - e ~ k , (5.6) 

々！ 

这就是著名的二項分布的普阿松逼近.（在問題 30— 34中，給出 
了它的誤差估計，幷且証明了当 oo 和 p — o 使得 A = 
保持有界时， (5.6) 的逼近是一致的 .） 为了方便起見，把 （5.6) 的 
右端引进一个符号，我們令 

p ( A ' A ) = (5.7) 

- ki 

采用这个符号，我 i 門可以 說：当 》充分大时， piK \ A) ^ b ( k \ n , 
的近似表达式. 


n 
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例. （ a ) 第四章表3中最后一刻的記录 h 給出了 〆 1) 
的数値.在前面几列中，心却給出了 b{m-, N, 的数値 • 这个 
表使我們能够比較普阿松分布 〆 w ; 1) 与具有？ = 1(« = 3 . 4 .5, 

n 

6, 10) 的二項分布.比較的結果吿訴我們，卽使当》很小时， - E 們 
的相合性也惊人的好. 

( b ) 表 2 比較了普阿松分布 pH 1 ) 与《 = loo. p — 的 

100 

二項分布.它表明在很多应用里近似程度是分人滿意的.現在考 
虑100对随机数字中 （7, 7) 出現的次数々，々的分布就是二項分 

布 100. — \表2 [43〗 中最后一列給出了每組为100对随机 
\ 100/ 

数字的100祖中（7, 7) 出現的次数.以100除最后一行的所有 
記录，我們就得到（7, 7) 出現次数的頻率，而这些頻率与理論槪 
率的一致性是合理的.[由 P 标准判断，在100次同样的情形中， 
大約75次会由于随机摆动而产生覌察頻率与理論槪率的更大的 
偏离 .] 


表 2. 普阿松近似的一个例子 


k 

b{k - 100 

5 TUo) 



0 

0.366 

032 

0.367 

879 

41 

1 

.369 


.367 

^879 

34 

2 

. 184 

865 

.183 

940 

16 

3 

.060 

999 

.061 

313 

» 

4 

.014 

942 

.015 

328 

0 

5 

.002 

898 


066 

i 

6 

.000 

463 

.000 

511 

0 

7 

.000 

063 

.000 

073 

0 

« 

.000 

007 

.000 

009 

0 

9 

.000 

001 



0 


头三列表明了二項分布的普阿松 近似. 最后一列是毎組为100对随机数字 
的100組中 （7,7) 出現次数的記录. 
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( c ) 生日.在 500 人所組成的人售中，恰有々个人的生日是 

• • 

元 P 的槪率内是多少？如果500人是任意选取的.則我們可应用 

成功槪率为 p = 1的500个伯努利試驗的模型.于是有外= 
365 

(364/365)«» = 0.2537 - 对于普阿松近似式，我們設 A = 500/ 

365 = 1.3699 - • 于是?(0, A ) = 0.2541. 它所产生的誤差仅在 
第四位小数上.当々=1，2, • • •，灼的正确数値由二項公式算 
出如下： Pi = 0.3484- • • , p 2 = 0.2388 • • • , p 3 = 0.1089. ••， p 4 = 
0.0372 - • • , = 0.0101 .…， p 6 = 0.0023 ---,其相应的普阿松近 

似値是 pCU A ) = 0.3481- • p { 2 ; X ') = 0.2385 . • _， p (3; A )= 

0.1089- • - ， p (4; A ) = 0.0373. •• ， p ( 5 ; A ) — 0.0102• • •, p (6; A ) 
= 0.0023- 所有的誤差都在第四位小数上. 

( d ) 废品.設瞟絲釘的生产是在絲計的貭量控制下进行，于 

• • 

是容許我們应用伯努利試驗的模型.若一个螺絲釘是废品的槪率 
为 p = 0.015, 則装有 1Q0 个螺絲釘的盒中沒有废品的槪率是 
(0.985) lw =0.22061. 其对应的普阿松近似値是 e~ l s = 0.22313 
•••. 在大多数的实际問題中，这样的近似程度已是相当好的.現 
在，我 們問： 一盒中应有多少个螺絲釘才能使得其中含有100个 
合格釘的槪率大于或等于 0.8? 設 100 + * 是所需要的蝾絲釘数， 
則文必是很小的整数，应用普阿松近似式于《 = 100 +〜 X = np , 
由于是近似地为 loop = 1.5, 故我們所求的 * 是滿足下面不 
等式的最小整数: C : 

，小 + 〒+.._+ .. “f } ^ 0.8. (5.8) 

查表 1} 知，当 x = 1 时， (5.8) 的左边是近似于 0.56; 而 x = 2 
时，則为 0.809. 因此，从普阿松近似式可得出如下的結論，卽所 
需要的螺絲釘是 102 个.因 0.809 是很靠近所給定的要求 0.8, 故 
102 个还是不太保险的，而 103 个是較保险 一®. 实际上，在--盒 

1) 参看 [44]. (这是給出数値 (々： 又）与<々；；!•）+ 〆 々+ 1; A ) + . •-的一些 
表格，其中々从0变到 100.) 
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102 个螺絲釘中，含有 1 G 0 个合格釘的槪率是 

(0.985) 102 4- Oo .985) wl (0.015) + 

+ (^^( O . PSSy ^ Co . OlS ) 2 = 0.8022- • •• 

(e) 某一指定的初生者活到 100 岁的槪率是很 
小的，而同时，士一个大的团体中，一年的出生数却是大的.由于 
战爭，传染病等等，不同人的寿命不是随机独立的.不过，作为首 
次的近似，我們可将》个出生者譬喻为》个伯努利試驗，真中活 
到100岁以后才死的就算“成功”.在一个稳定的团体、也 卽团体 
的大小与死亡率孰为是不大改变的，我們有理由期望，恰有4个百 
岁老人死4的那些年头的頻率是近似于#»(々； A ), 其中 A 依賴于 
团体的大小及健康情況 . 瑞士的記录証实了这結論 

( f ) f 學宁，于， ff . 設在一本书的印刷中，如果一个 

字印錯的 iii 又*如^果印刷的条件保持不变，則我們有与 

字的个数一样多的伯努利試驗，幷且恰有々个錯字的頁数的頻率 
将近似地等于 K 4; ，其中 A 依賴于印刷者的技术水平.印刷者 
的偶 然疲倦或困难的章节等等都将增加印錯的机会，幷且还可能 
产生成羣的錯字.因此，普阿松公式可用来发現对于均勻性或統 
計控制的过分偏离.类似的推理可用于許多其他的情形.例如， 
若将許多葡萄千混合到一堆生面团中，則我們可期望恰有々粒葡 
萄干的面包的个数的頻率是近似地等于 A )， 而 A 是生面团中 
葡萄千的密度. 


6. 普阿松分布 

在前一节中，我們仅仅用普阿松表达式 （5.7) 作为 n 大 p 小的 
二項分布的一个合适的近似式.关于第四章的相合問題与占位問 
題，我們曾經硏究过各种不同的槪率分布，而这些分布的极限形式 
也造普呵松表达式 Kt A ). 这正是下述的値得注意的事实的特 
殊愦形：有儿个具有高度普遍性的分布在极其多种多样的問題中 
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出現.在槪率論中常遇到的三个主要分布是二項分布，正态分布 
(于下一章介紹）与普阿松分布 

义 ） =〆 (6-1) 

k\ 

后者我們将加以討論. 

我們注意，如果将 （6.1) 的右边对4= 0, 1, 2, ••• 求和，則得 
到与^的泰劳級数的乘积.因此，对任何固定的; I ,所有的 
pU ； A ) 的和是 : L . 于是，我們可以設想一个理想的試驗，使得恰 
有々个成功的槪率是 A ). 我們将 說明： 为什么許多物理試 
驗与統計規察都导至普阿松分布 (6.1) 的如上的解释.下一节的 
例子闡明了 （6.1) 的广泛的、种种重要的应用.只能在随机过程的 
理論中才明显地看出普阿松分布的实貭（参看原书17章，卞給出 
普阿松分布的一个新的描述). 

考虑一个随时間而发生的随机事件序列，例如放射性 分裂； 来 
到电話总机的呼喚等等.每个事件都可由时間軸上的一点来代 
表，而我們所关心的是这些点的随机分布.这分布有各种不同的 
类型.但乍們的硏究是属于連續槪率的范围，我們預备在第二卷 
再談.这里.我們将滿足于說明以下的 事实： 在最簡单的物理假 
設下可以 得出 ： pih A ) 就是“在一个指定长度的固定区間內有 
々个点(事件)”的槪率.本节中，我們所用的方法是粗链的.在第 
+七章,我們将以更适当的方法来处理这个問題. 

我們需要把以下两个物理假定用数学語言表达出来： 1) 对 
时間而言，試驗是在固定不变的情祝下进 行的； 2) 在不相交的几 
个时間区間中，事件的发生次数是随机独立的.在連續型的槪率 
理論中，我們可以直接地表达这些陈述，但由于限制在离散型的范 
围以內，我們只得先用一个近似的有限模型，然后再过渡到极限. 
我們想象把单位时間区間分成为数很大的》等分，每个子区 

間的长度是丄.于是，一个指定的子区間或是空的或是至少含有 

n 

一个随机点（事件).我們分別称这两个可能的情形为失敗与成 
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功.由干》个子区間的长度是间样的，因此，在每个子区間中，成 
功的槪率 也应該相同.还有，不相交区間的独立性便我們能够 
把这种現象考虑为》个伯努利試驗，其中恰有4个成功的槪率是 
Kt ， n, p„). 因为一4子区間可以含有若干个随机点，所以成功 
的次数与随机点的个数就不一定相同.但是，我們可以很自然地 
引进一个附加的假設，卽在一个很短的时間区間內出現两个或多 
个随机点的槪率是可以忽略的在这假設下，单位时間区間中恰 
有々个随机点的槪率可由《 — oo 时 p „) 的极限来表出. 
現在，我們把每个子区間再分成两等分，則有= 2#^ ~ (因 

为在长度为1的区間发生成功意味着在左半边，或右半边，或左、 

n 

右两半边发生成功 .） 于是有内 < 2这使我們想到，是单 
調增加的（我們可以严格証明这点).若即„ — A ， 則 b{k\n, p„) 
〜*(々；《， X / n )^ p ( k ', A ), 于是， (6.1) 可作为单位时間区間內 
恰有々个随机点发生的槪率.倘若我們假定 — oo ，就得不到 
有意义的結果.因为这隐含着在无論多短时間內可以有无穷多个 
随机点. 

如果以长度为 * 的区間来代替单位区間，幷且把单位区間分 
成許多长度为丄的子区間，那么，我們仍有一串成功槪率是〜的 

n 

伯努利試驗，不过試驗的次数不是》，而是最靠近加的那个整数. 
过渡到极限后还是一样，不过是把又換成以而 E . 因此，我們考 
虑 

〆 々 ;“）== (6.2) 

ki 

作为长度为£的固定区間內恰有 々点 发生的槪率.特別，在长度 
为 t 的区間內沒有一点发生的漑率是 

1) 用这个假餃时須要注意：那随机事件不要是成对发生的.举例來說車祸”的 
事件不是成对发生的.我們的假設就能适用：在很短的时間內发生两次的槪 
奉比发生一次的槪率小得多.伹是“車被撞毀”的事件就是成对发生的，因为車 
总是被別的車撞毀的，而別的車也不免撞毀了，予是我們的假設就不适用. 
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p (0; Xt ) = e ~ lt , (6.3) 

从而，有一点或多点发生的慨率是 1 — e ". 

参数 A 是一个物理常数，它是由 z 軸上随机点的密度来决定 
的 . A 愈大，沒有点出現的槪率 （6.3) 愈小.設一个物理試驗大量 
的重复进行例如說 W 次，幷且每次我們都記录下在长度为/的固 
定区間內事件发生的数目. 又設心 是恰有灸个事件发生的次数， 
則 


N 0 + Ni + Ni + ■ • * = N _ (6.4) 

亍是，在 AT 次試驗中所观察到的点的总数是 

N ! + 2 N 2 + 3 iV 3 + ••- =7% (6.5； 

幷且其平均数是 T / N . 如果 iV 很大，則我們可期望 

( 6 . 6 ) 

(这是槪率論所有应用的基础，我們将于第+章中用大数定律給予 
証明且加以精确化）.将 (6.6) 的結果代入（6.5)，我們得到 
T ^ iV {^>( l ; Xt ^) + 2 p (2; A ?) + 3^(3; A ?) + • • •} 

= Ne-^Xt{l + ♦ + ^ +•••} = Nit ， (6 . 7 ) 


于是 


It . ( 6 . 8 ) 

N 

这关系式提供了一个从覌察値去估計 A 以及将理論与試驗相比較 
的方法.我們将在下一节的例中說明这点. 

空間中的分布. 我們已考虑过随机事件或随机点在 z 軸上 
的分布問題，但同样推理可以应用到平面或空間上的点的分布， 
我們以面积或休积是£的区域来代替长度是 r 的区間，幷且，我們 
的基本假設是任何固定的区域中恰有4点发生的槪率仅与区域的 
面积或体积有关而与其形状无关.此外，我們还有与以前相同的 
假設： 1) 当 r 小时，在体积为 f 的区域中有多于一点发生的概率 
与 r 相比較而言是 小的； 2 )不相交的区域是彼此独立的，为了求 
出在体积为 < 的区域中恰有々点发生的槪率，我們将区域分成許 
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多子区域.幷用》次試驗中恰有々次成功的槪率来逼近我們所求 
的槪率.这就是說忽略了同一子区域中有多于一点发生的可能 
性，但由假設1)，当《 403时，其誤差趋于零.于是，在取极限以 
后，我們又得到普阿松分布 (6.2). 天空中的星体，蛋糕中的葡萄 
千.牧草种子中的杂草种子，物貭中的瑕疵，以及原野中动物巢穴 
等都按照普阿松定律来分布.至于实例，可参看例 （7. b ) 与 （7. e ). 

7. 符合普阿松分布的覌察結果 

( a ) 設放射性物貭放射出《貭点，在时間*內 

到达指定数，是随机事件遵从普阿松定律的著名例子. 
当然，由于放射性物貭在不断地縮小，时間太长的話，《貭点的密 
度就要下降.但是，就鐘而言，不經过許多年，物貭的減少是覚瘵 
不出来的.于是，对于較短的时間区間，情祝可考虑为不变的.因 
此，这現象滿足导出普阿松分布的理想假設. 

在一个著名的放射性物貭的試驗中，我們覌察 N = 2608次， 
而时間区間是 7.5 秒，幷且每次都記录下到达指定区域的貭点数. 
表3給出有々个貭点的区間数心，而貭点总数是 T = = 


表3 . 例 (0 :放射性分解 


k 

Nk 

八>(々；3. 870) 

0 

57 

54.399 

1 

203 

210.523 

2 

3 S 3 

407.361 

3 ' 

525 

525.496 

4 

532 ^ : 

1 

508.418 

5 

408 

393.515 

6 

273 

253.817 

7 

139 

, H 0.325 - 

8 

45 

67. 882 

9 

27 

29.189 

々>10 

16 

17.075 

E 数 

2608 

: . 

2608.000 
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10,094, 平均数是 T/N = 3.870. 理論数値 N P {^; 3.870) 是很靠 
近于观察数値的.要判断两者的拟合程度，我們需要对随机起 
伏的可能范围进行估計.統計学家是用检驗来判断拟合度的. 
由这准則，人們可預期在理想的条件下，100个类似的情形中，大 
約有17个的拟合程度比表3还要差. 

( b ) 學牟咚譽巧， 学. 作为随机点的空間分布的例子，我們 
考虑第二年伦敦南部的飞弹的統計.将整个面积 
分为 iV = 576 块小面积，每小块面积是 1/4 平方公里.表 4 記录 
了中々个飞弹的面积数1投下飞弹的总数是 T = S/iN k = 537, 
平均数是 h = T/N= 0.9323 …. 这观察結果对普阿松分布的 
拟合程度是很好的.由妒-检驗可知，在理想的条件下 ， 100次比 
較中大約有88次的拟合度比这观察結果的拟合度还要差.我們 
有兴趣的是，大多数人都相信受弹点有聚結的傾向.果眞如此，中 
弹很多的地区与沒有中弹的地区岜不是要多些，而中間的情形要 
少些呢？然而表4却明白地表出完善的随机性与均勻性.这个例 
証說明了一个公孰的 事实： 随机性到了沒有訓栋的眼睛里，就会 
成为有規則性或有聚結的傾向. 


表 4. 例 （ b ): 投在伦敦的飞弹 


k 

0 

1 

2 

3 

A 

5 以 _t 


229 

211 

93 

35 

7 

1 

K ^； 0.9323) 

226.74 

211.39 

98.54 

30.62 

7.14 

1.57 


( c ) 嘲喂宁举争乎巧辛學. X 射綫的照射产生了有机細胞 
中的某种 i 化过程，这 fiaii 叫作染色体的交換. 在連續 照射的 
过程中，发生交換的槪率是保持不变的.按照理論，恰有々个交換 
发生的細胞数服从普阿松分布，而且理論上还可預言参数义与 


1) 这数字是由文章 [46] 得出的， 
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照射強度、温度等等的关系.但是，我們不打算詳細討論这些內 
容.表5 記录了 U 种不同試驗的結果.它們是按照拟合度排列 
的.最后一列給出了理想情形的逼近的百分比，在这些情形中，随 
机起伏使得拟合度更坏（用标准检驗).发現拟合度在理論値 
与覌察値之間. 


A 5. 例 (0: 由于 X 射綫的照射而引起的染色体的交換 





有々个交換的細胞 



欠 2 水准 


实驗数 





总数 N 

的百分 








■■ 

1 

2 

>3 


上匕 

I 

現 察値心 
A/p(^;0.35508) | 

753 

752.3 

266 

267.1 

49 

47 A 

L 

1073 

i 

95 

2 

覌察値 N* 

434 

195 

44 ! 


682 

85 

iV>(^；0.45601) 

432.3 . 

197.1 

44.9 



覌察値 

280 I 

75 ! 

12 

L, 

368 

65 

^p(^;0.27717) 

273.9 

77.3 

10.7 


4 

覌 察値化 

zVp(^; 0*11808) 

2278 | 

2280.2 

273 

269*2 

15 

15.9 

■ 

2566 

65 

5 

現察値〜 

593 

143 

20 


759 

j 45 


Np(^；0.25296) 

589.4 

149.1 

18.8 

1 

6 

現察値？^ 

639 

141 

13 

L 

795 

45 

0.21059) 

642.4 

135.3 

14.2 


7 

現察値〜 

359 

109 

13 

1.5 

482 

40 


0.28631) 

362.0 

103.6 

14.9 


8 

現察値以々 

493 

176 

26 

1 2 

i 3.4 

697 

35 

0.35372) 

498- 2 

167.3 

2SA 


9 

現察値化 

793 

339 

62 

5 

1199 

20 

0.39867 s ) 

804.8 

320.8 

64.0 

1 9.4 



硯察値 

579 

254 

47 

1 3 

883 

20 


〜〆々： 0.40544) 

1 588.7 

238.7 

48.4 

1 7.2 


U 

覌察値 

! 444 

252 

59 

1 

756 

5 

1 

0.49339) 

. 461.6 

I 227.7 

56.2 

mm 



( d ) 表6是电話接錯的一个統計 13 ，其中被观察的 

电話叫次 i 4 r iV = 267个，而 AT * 表示恰有々次接錯的电話数. 


1) 这統計表是由論文 [47；) 中得来的，这論文含■有32种不同統計表的0形分析. 
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我們再一次看到，普阿松分布 〆 七 8.74) 对这覌察結果的拟合程 
度是很好的（由检驗，偏差靠近于中値).在論丈 [47 ] 中，讀者 

表 6.. 例 （ d ): 电話接錯 


k 


NpUc , 8.74) 

0-2 

1 

2.05 

3 

5 

4.76 

4 

11 

10.39 

5 

1 A 

18.16 

6 

22 

26.45 

7 

43 

33.03 

8 

31 

36.09 

9 

40 

35.04 

10 

35 

30.63 

11 

20 

24.34 

12 

18 

17.72 

13 

12 

11.92 

14 

7 

7.44 

15 

6 

4.33 

>16 

2 

4,65 


267 

267.00 
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图 I . 細菌在标本片上， 




可以找到遵从普阿松定律的其他电話統計.在某些情形（例如有 
分机的团体綫及公用电話等）事件之間是有明显的依賴关系的， 
此时，普阿松分布就不能适合所观察的結果了. 

( e ) 图1表示涂上細菌羣的 Petri 片的 

照象，在显 if 鏡 1 V 規^*細_菌羣呈現为黑点.将片分成一些小方块. 
对于八种不同的細菌作試驗，表7記录了 恰有々 个黑点的小方块 
数_.这里，我們得到了普阿松分布应用于随机点的空間分布的 
—个重要实际典型的例子. 

表 7. 例 0): 紬菌的分布 




16 

.8 16.2 


7 

S .2 


60 80 
62.6 75.8 


26 

26.7 

26 

26.4 

38 

32.5 

17 

16.7 

49 

60.8 

30 

30.0 

135 

139.4 

101 

89.7 

18 

19.2 

15 

15.1 

11 

13.7 

11 

12.0 

14 

15.8 

21 

20.2 

45 

45.8 

16 

18.5 



每一 行的最后一个数据都 包含了 更高分組的图形，因而应該标以“々或者更 
多个' 

8. 等待时間.負二項分布 

考虑《次相継的伯努利試驗，我 們問： 一直到出 現第” 次成 
功为止到底需要作多少次試驗. 其中， 是一个固定的正整数.当 
然，《次試驗的成功次数可以少于^但第次成功发生在第 
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次試驗的槪率不依賴 于《 ，而只依賴于 V ， r 和因为一 
定有 r , 所以我們愿意把》写作 u = r + t 第 r 次成功发 
生在第，+々次試驗（其中々= 0, 1，…）的槪率用 f (々； r , p ) 
来表示.它等于在》•次成功之前恰有々次失敗的槪率.而这个事 
件的发生，当且仅当 r +々一 1次試驗中恰有々次失敗而下一次 

(卽第 r +々次)一定出現 成功； 但它們的槪率分別为 + 

和 h 所以 

/( 々 ; r ，穸 )= (’ + f X ) * P r< l K . (8*1) 

用第二章 (12.4) 把二項式系数改写一下，便得另一 形式： 

/(々； r , p ) = (々 r ) p r (— 《)*，々= 0, 1，2, - •(8.2) 

現在假定伯努利試驗一直継續到第 r 次成功出現为止.一个 

标准的样本点可以用这样一个序列来 表示： 具有 K 个 F ik 任意） 

恰有，个 *5 而且序列的最后字母是 ■$; 由定义，这样的点的槪率 

为 p r g \ 然而，我們必 須問： 試驗一直作下去不完的可能是否存 

在，也就是說，是否有无穷試驗序列，其成功次数少于 r . 因为 
06 

r , p ) 是第 r 次成功发生在有限次試驗的 槪率； 因此，一个 

无穷試驗序列中所包含的成功次数 少于” 这个事件不可能发生当 
且仅当 


2似； r 5 ?) = !. ( 8 -3) 

* = 0 

为了証明 （8.3) 成立，只須 注意： 由二項定理 

_(了)(- y ) 4 = U - q)~ r = p ~ r . (8.4) 

将 （8.4) 乘以火我們得到 (8.3). 

在我們的等待时間問題中，： r 必須是固定的正整数，但是由 
(8.1) 或 (8.2) 所定义的量是非負的，而且 （8.3) 对任何正数 r 都成 
立.对于任何一个固定的实数？ •>(> 和序列 { M ; ，， P )} 
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叫作負二項分布.在很多应用中会碰到这一分布.（在第五章問 
題24里它是作为波利亚分布的极限形式出現的 .） 当 r 为正整数 
时，{/(^； r , p)} 可以解释为第 r 次成功所需之等待时間的槪率 
分布; 正由于此，我們也把它叫作巴斯加 （ Pascal ) 分布.当 r == 1 
时，卞 化为 几何 分布 { pq ^}. 

表 S _ 槪率 （8.5) 









.079 

589 

.079 

589 

.078 

785 

.077 

177 

.074 

790 

.071 

674 

.067 

902 

.063 

568 

.058 

783 

.053 

671 

.048 

363 

.042 

989 

.037 

676 

,032 

538 

.027 

676 


0. D 79 

.159 

.237 

.315 

• 389 

.461 

.529 

.593 

• 651 

• 705 

.753 

.796 

.834 

• 867 
.894 


589 

178 

963 

140 

931 

605 

506 

073 

855 

527 

890 

879 

555 

094 

770 



15 0.023 171 0.917 941 

16 .019 081 .937 022 

17 .015 447 .952 469 

18 .012 283 .964 752 

19 .009 587 .974 338 

20 .007 338 .981 676 

21 .005 504 .987 180 

22 .004 041 .991 220 

23 .002 901 .994 121 

24 .002 034 .996 155 

25 .001 392 .997 547 

26 .000 928 .998 475 

27 .000 602 .999 077 

28 .000 379 .999 456 

29 .000 232 .999 688 


假定开始时每盒火柴有 50 根，〜是发現第一盒空时第二盒恰有 r 根火柴的槪 
率 . W + "1 + • - • + 是对应第二盒不多于 r 根的概率. 

例.冬荸亭 P 声寧.某一数学家經常在左边口袋放一 

盒火柴，右二 i 又 i . 当他要用火柴的时候，它随机地从 

—个口袋中去取火柴，因此連續的抽取构成了一串 ?=— 的伯努 

2 

利試驗.假定最初每盒火柴恰巧包含 W 根，我們 考虑： 数学家第 
—次发現空盒子的时刻.在那一时刻，另一盒火柴可能还有0 ; 1， 
” •，/ V 根火柴，我們用 W 表示其对应的槪率.我們令从左边口 
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袅选取为“成功”.“当发現左边口袋的火柴盒空时右边的火柴盒 
中尙有根火柴”这一事件当1 •仅当 下列事件发生时才发生：恰 
有 N - r 次失收发生在第+ 1次成功之前.这个事件的槪率 

为 f r W + 1，同样的推理可以用之于右边口袋.因 

此.所要求的槪率为 

= (2 A 7 — r 

V N 

表8給出 W = 50时^的数値[尜看問題 21—23 和第九章例 
(3. f )]. 


■) — 2N 十 r 


(8.5) 


U r 


2f{N— r ; 4- 1 


，含) 


9. 多項分布 

二項分布很容易推广到一般的情形，卽每次試驗有若干个可 
能結果的”次重复独立試驗.設&，•…，是年次試驗的可能 
結果，且每次試驗中 £■,. 发生的槪率是/»,(纟=1, 2, • • •. r ). 当 
r = 2时，它化为伯努利試驗 序列； 在一般情形，&应滿足以下的 
条件 

pi + p 2 + • • • + p r = 1 pj ^ 0. (9.1) 

n 次試驗的可能結果可表为形如 E^Ey - - n 元序列.幷且在 n 
次試驗中 馬出 現也次，五 2 出現心次，…，尽出現匕次的槪率 
是 


n \ _ 

々 1! 々 2 ! .U 


P^Pz S p3 S - - •〆 ，， 


(9.2) 


其中冬是任何非負的整数幷且滿足 

々1 + 々2 + ... +&==»• (9.3) 

当 y = 2时 5 (9.2)就化为二項分布，其中 pi = p , p 2 ^ q -, 

从第二章公式 （4.7) 出发，我們可用証明二項分布的 
方法来証明这个一般情形的公式. 

因公式( 9 .2)是（朽+ _ _ * + 〜)” 多項展幵式中的一般項，故 
(9.2) 称为多項分布.迖分布主要应用于个体被区分为多于两类 
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的有放回抽样(例如，按照职业 进行分 类）. 

例. （a) 擲12个般子，問骰子的每面都出現两次的槪率是 
多少？設五 2 , …， E 6 表示般子的六个面，由于々,= 2,巧= 

+ , / = 1，2,…，6,所以我們的答案是 （12!) C2)- 6 (6 )~ n = 

6 

0.0034 - - •. 

(b) 把一个具有 A/ 个元素的总体 分为” 个子类 A， 
的大小分別为 N Pl , … ， Xp r . 多項分布給出了由 

这个总体中有 放回地 柚取一个大小 为 》的随机样本的各种可能袓 
合的槪率. 

( c ) f 零咱琴巧穿學.两串伯努利試驗合在一起可考虑为 
—个具有四个可能結果 （ S ， 5)， （A F ), ( F ， 幻， ( F , F ) 的联合 
試驗，其中巧，仍 与内， 仍分別为这两串伯努利試驗的成功槪率与 
失敗槪率.如果这两串試驗是独立的，則联合試驗中四个可能結 
果的槪率分別为 PlP 2, pm , < hp 2, ㈣ 2.若 m 心是四个整 
数，其和为》，則《次:联合試驗中 M 出現 心次， i 下出現心次， fA ’ 
出現 t 次， 出現心 次的槪率是 

- -户卜 + 〜^3 + *1^1 + 〜}， + *4. ( Q .4) 

々1!々2!々3!々4: 

抽样检查过程可作为我們的一个特例.一个成品是合格或废品的 
槪率分別为 P， 《，成品是否被检查的槪率分別为〆，〆，因成品是 
否被检查与它的貭量无关，所以我們有两串独立試驗[参看問題 
25与26,以及第九章問題 12]. 

10.問 題 

1. 設性別的分布都是等可能的，問六个小孩的家庭中恰有三男三女的槪 
率是多多？ 

2. 一个玩桥牌者連續三次沒有得到爱司，他是否有理由埋怨运气不好？ 

3 . 随机数字序列要有多长才能使得序列中数字 7 出現的槪率至少是 
9 / 10 ? 

4. 設在玩桥牌中毎次桥牌分配是独立的,問需玩多少次才能使得一个事 
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先指定的玩牌者至少有一次得四张爱司的槪率大于1/2?如果“将事先指宏 
的玩牌者”換为“有一个玩牌者”，則結論又如何？ 

5.設 中靶的 槪率是1/5,問十次独立的打祀中至少有两次中靶的槪率是 
多少？ 

6 •在上題中，如果己知至少有一次中靶，問至少两次中靶的条件槪率是 
备少? 

7 .—組任意选取的13张桥牌中，恰有两张紅牌的槪率是多少？丼将这 
槪率与成功槪率为+的伯努利試驗中的相应槪率相比較[关于桥牌的 
描述，可参看第一章的脚注]. 

8 •六个人的生日都在十二个月中的任意两个月份，而在其它的十个月 
份內沒有这六个人的生日的槪率是多少？[假設毎个人的生日是彼此独立 
的，幷設，生日发生在某个月份是等可能的 .] 

.攤六个骰子，求以下的槪率：（幻至少有一个么点出現； （ b ) 恰有一 
个么点出現； （0 恰有两个么点出現.幷与相应的普阿松近似値相比較. 

10 .如果慣用左手者的平均百夯数是 1%， 試計算200人中至少有四个 
为慣用左手者的槪率. 

11. 設一本500頁的书中含有500个錯处，試計算一頁中至少有三个錯 
处的槪率. 

12. 如果总体中色盲者的百分数是1%,問有放回的随机样本应該多大 
-十能使样本中有一个色盲者的槪率大于或等于 0.95? 

13•在上題中，如果样本的大小是100,求以下的槪率： （ a ) 样本中沒有 
色盲者； （ b ) 样本中至少有两个色盲者. 

14 .如果想赴蛋糕中至少含有一粒葡萄干的槪率大于或等于 Q • 99,試計 
算蛋糕中葡萄干的平均数. 

15. 扑克游戏中出現最大同花的槪率是1/649,740,問®要多大才 
能使》次扑克游戏中沒有最大同花出現的槪率小于(注：不用計箅 
便可得出答案）. 

16. —本书包含》頁，每一頁的印錯处平 均为久 計算至少有一頁其中印 
錯之处超过々的槪率. 

17. 假定有两类顆粒(例如点心中的不同类的葡萄千，貭料中的不同类的 
杂貭）.在一•块給定的体积中，第一类的顆粒恰有；个的槪率为<0,第 
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二类的顆粒恰有々个的槪率为 pU ; 而且这两个事件是假定为相互独立 
的.証明这个給定的体积中总共包含》个顆粒的槪率为 ?(»；« + b ) (把这 
—論断和假設加以抽象化） . 

18. 辛罕项 街道交叉口上的交通的暢通程度是用任意給定的一秒 
钟內有一'部¥子'通过的概率 P 来描述的；而且在不同秒的时刻車子的經过是 
互不影响的.把秒作为不可分的时刻单位，于是伯努利試驗槙型可以应用. 
假定一个步行者只能在后三秒钟沒有車子通过的情形下才能跨过街道.求 
出一个步行者恰巧等待4=0,1, 2,3, 4秒的槪率.（其一般的公式幷不很 
显然，在第十三章第7节討論成功的連貫理論时将把它推出来 .） 

19. 設两个人都扔》次綫币.求錢币出現正面的次数相等的槪率. 

20 .在一串成功槪率为 P 的伯努利試驗序列中，求《个成功出現在6 个 
失敗以前的槪率. （注： 这个結果至多在 a + 1 ,- 1 次試驗以后就可决定. 
这問題在赌博的古典理論中起着作用，它和下面的如何分賭注的問題 有关： 
当一方差 a 点获全胜，另一方差6点获全胜时賭博中断，如何分配賭注 .） 

21 •卒弓 _呼冬 荦窣喟 M (第 8 节）中， 求出： 一盒恰用完（而是拿出来 
发現它是 bW ) '时^一¥尙 '恰有 (其中2, •••,〜） 根火柴的槪 

率. 

22( 績上）.应用上面的結果,求出首先用完的那一盒不是最初拿出而发 
規它是空的的槪率\幷証明由此所得之表达式可化为 x = ( 2 n ) 2-2 〃，或 
者近似地为 （ N 〃)_ V 2. 

23 .两个校对者独立地校对某一本书的印样，他們各发現幻和 h 个錯 
誤，其中有々 12 个錯誤被这两个人同吋发現.試給出印样的錯誤的个 数”的 
一个合理的估計.（假定这两个校对者对应于伯努利試驗，他們发現一个錯 
誤的槪率分別为 P 1 和尥.可应用大数定律 .） 

注意： 这个問題是用簡单术語来描述罗泽鎘特 (Rutherford) 的,閃燦計 
数試驗裝备的. 

24 .用陷井来估計一羣野兽的总体的多少接連設立 r 次陷井.假定 
每一个野兽陷入的概率都同样为？；最初共 有”个 野兽；只当野兽被捕（拿 
走）时，两次相継設立陷井的•淸况才会改变.求 出*' 次陷井捕获的野兽分別 
为 • • •，” r 的槪率. 

在例 （ 9 * o 中，如果知道化 o 与（匕 o 中有 
一个发生’， S ) 发生的条件槪率 P 及証明当时， 


• 165 • 




P> 士；当 P 2> B \ 吋,/><士. 

26( 續上尸.如果已知在《对試驗中（5, O 与 （'■=>') 共发生》*次，証 
明0, f ) 恰巧发生々次的槪率是”， /0. 

2 - 設一只昆虫生个卵的槪率是 
p { r ； ^), 又設每个卵是否发育为_虫是彼此 

浊立的.証明有々个后代的槪率是遵从参数为 v 的普阿松分布/ 

注意： 同样情况下的另一个 例子： 《个染色体分裂的槪率为义）， 
一个分裂的染色体恢复原状的槪率为（类似的一些其它的例子，請参看第 
九章例 （1 .d) 及第十二章第1节 .） 

28.証明定理 1 2) :多項分布 （9.2) 的最大項滿足不等式 

npi — l<ki<z{n + r — l)fi, < = 1 , 2 , • ■ ■ , ( 10 . 1 ) 

(提 示： 首先証明，最大項的充分必要条件是 Pihf^Piihi + 1) (对每一对 
(<,;)) .把这些不等式对:全部的/加起来，同时也对全部?加起来 .） 

29 .当々是不起过;I 的最大整数时，普阿松分布中的項达到最 
大値. 

注意： 問題; 50—34 是关于二項分布的普阿松這近的. 把邛了 解为、 
« 了解为不超过 （》 + 1)P 的最大整数（也就是說，"》是二項分布的中心項的 
指标）， 

30.証明当々从0跑到 CO 吋， P 、/ pUc , 入 )最初上升而后下 
降，而且在々=«时达到它的最大値. 

31 .当々增大时， Kk-, n, p) 最初比 p(k ； 小而后变大最后又变得比 

P (七; 久）小. 

32 .如果 》— 00, p-»0 使得 np = ^ 保持为常数，則 

h ik', », p) —*• p(k ； 

对全部々一致地 成立. . 

33.証 明： 


1) 参看〔50]. 3C 尔德 （Wald) 利用这个結果詨計了一个实用的方法，用于比較 
两串由經驗給定的 試:驗 （例如，两架机器的产品），而选出成功槪率較大的一串. 
他把这問題簡化为如下的問題，在一串伯努利試驗里求成功頻率是否显著地不 
同于 1/2. 

2) 在第一版中， 只断言 |々， - .此处的改进和精拣的証明都厲于莫萊 （ P . 
A. P. Moran). 
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淡 —+)”、 伙 》，心异(卜 DU )' d ) 

34 •应用第二章不等式 （8.12), 从 （10.2) 推出 

p { k ', 又)4又/">办（々； n , p ) > p (々； 又)<: - 4 2 /(" - 々) _ 乂 (10.3) 

注意： 虽然 （10.2) 非常粗键，但 （10」） 却給出較精确的誤差估針.用类 
似于第二章第 <) 节的計算方法可以很容易地改进 (10-3). 附带提一 下：应 
用問題30的結果，容易看出（10_3)左边的指数可以用来代替，而后 

者 <(P + 厂 ”又 • 


其他的极脤定理 

一个包含有 w 个元素的总体分为紅黑两 
类元素，•其•比•例•为 P ; 9’(惫士 P + ^ = 1). 无放囬地抽取一个大小为"的样 
本.其中恰有々个紅元素的槪率由第二章第6节的超几何分布所給出.証 
明：当 N ->00 时这个槪率趋于 Kk ；^, p ). 

36 .在前面一个問題中，令 P 很小 n 很大而 A = 大小适当.于是超几 
何分布可以用普阿松分布 P ( h ； 来逼近.不用二項逼近来直接驗証这个 
关系. 

37 •在第8节的負二項分布 （/( 々：》•， #0} 中，令 < y — 和 '■- *oo 使叫=久 
保持常数. 証明： 

i { k ； r , p ) -* p(k : . 

3 S •争* 巧弯 吁學兮节. 当”很 大而印/ = \ 大小适当时，多項分布 

(9.2) 可 . 

厂 ( W + V ) 又 fi 岭…入> 

々1 Mz ! • • •々>■! 

来逼近.幷鉦明这些項之和为 1. (注 意： 問題17和二重普阿松分布有咲 
系 .） 


30. ( a ) 应用显然的关系 

*(々；《， P ) = K ” 一々； ”， 4) 

从 （3.5) 直接推出（ 3 . 6 ). ( b ) 用归納法和从第四章（ 3 .1)的一般的求和公 
式推出二項分布. 

40 .証明 Sb.l>(h-, n, p) = Kp 和 n, p) = n 2 ffi 4 - npq. 
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41.証明《;4(々； A ) = V + A . 

42 •驗証等式 

k 

2為 ( v ; ” 1 ， p)Kh — v ； n 2 y p ) = H 々； ai + ” 2 , p )， (10.4) 

v *0 


幷解释这等式的槪率意义. 提示： 利用第二章的公式（ 6 . 4 ). 

注意： 等式 (10.4) 是卷积的特殊情形，这在第 i -一■章将提到，而另一个 
特例是 （10.5). 

43. 驗証等式 

k 

^! p ( v ； 又1)?(々 一 V ;又2) = P (々； 久1 + 〜• （10-5) 

y *0 

44. 設 

k 

B (々； ”， f ) = 2 古 ( V ; n ，尹） （10_6) 

v = 0 

是”次試驗中至多有々个成功的槪率，則 

B ( k ； » 十 1， P ) = B(kl n 9 p ) — pKk \ 贷， P )， (10.7) 

十 l : « 十 1， p ) = B (々； 》， p ) + #(々 + i ; »， P ). 

試給 （ a ) 由 定义出发的； （ b ) 分析的，証明. 


45. 証明 

s ( 々 ; ”，#0 = ( n - 々 ) （S ― i)^dt (10.8) 

与 

1 ~ B ( k ； n , p ) |^4(1 (10.9) 

提示： 用分部积分法或将等式的两边对 p 求导数.这两个結果可以5： 
相推导. 

注意： （10.9) 中的积分是不完全的貝塔 （ Beta ) 函数.对于々与*从0 
变到50,以及?> = 0.01, 0.02, 0.03, 1 — B (々； 》， p ) 的七位小数表是 

由下面的书： “ K . Pearson, Table of incomplete beta function，London 
(Biometrika Office ) , 1934” 給出 • 

46 . 証明： 

p (0 :又） + . • _ p (»； 久 ） s •丄 1 e ~ x x n dx m (10.10) 

nt JX 


注意：在下面的問題中 我們对 二項分布所有各項給以一个上界.計算 
是很簡单的，其方法經修改后可以給出德模佛-拉瞀拉斯极限定理一个最簡 
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華的推导（参看第七章問題 19—21) .令 


k — (" + 1 )P + . 




{(» + 1) P ?) 1/2 ’ 

且令 "•为 中心項的指标； SP 是說，是滿足 （3.2) 的整数. 
47 •葩明当 r >(» + 1 )P 时有 

厶 ( r ; «， «3 /0 厂丁 + ， 


( 10 . 11 ) 


( 10 . 12 ) 


其中 6 = m — (n l)p -f - L , 从而 |6 l < 


提示： 把 (3.1) 写成下述 形式： 

b{k' n, P 、 = (» + l)p<? 一 {^ — (« + l)p}p 
b(k 一 1 ; »， p ) (”十 l)pg 十（々一 （n 十 


对❽ （《 


1)? 可推出 

n , p ) 


log 


厶（々一 1; 浐） 


< loKS 1 


々 一（》+ l)p 

(« + 1) 押 


P )< 


々 一（《 十 l)p 
(« + 1)?-? ’ 


(10.13) 


(10. H ) 


从而求和卽得所需之結論. 

48.对于 r <(” + l ) p ， 不等式 (10.12) 仍然成立，只不过把指数上的 P 
換成0罢了.因此，如果 以抑代 則不等式对全部 r 都成立 • 
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第七章二項分布的正态逼近 


1•正态分布 

为了以后的方便，我們在这里先引进两个重要的函数. 

定义.函数 


含 o) 

称为正态密度 函数； 它的积分 

就叫作正态分布函数. 


(2tc ) 吾 


(2n)i 


2 

(i.i) 

dy 

( 1 . 2 ) 


辛 O ) 的图形是对称的鉀形曲綫(如图1所示） . 但須注意，图 
中两个坐标軸所取的单位是不同的.的最大値为 (23 t ) - ^ ^ 


0.399. 所以，在通常的（同单位的）笛卡尔坐标里 y = 命 00的 
图形比画出来的要扁平得多. 

引理 1. 命0)的图形与 r 軸所围成的区域的面积为 1 ， 卽是 


| c />( x ) dx 1. 

(1-3) 

証. 

我們有 



{( <^)(^) dx \ = ( [ dy 

(.J — » ) J ~~ as J —co 



=丄厂 p e -^^ Hxdy . 

2 n ) -» J -» 

(1.4) 


这个重积分可用极坐标来 表达： 

— f d 9 f e~^r dr — [ e - ^ ,4 r dr = — e~ = r * = 1 , ( 1 . 5 ) 

2tv Jo J 0 0 


至此，引理証毕. 


• J 7 (J • 



4>( x ) 



.面 积的50% 

的63.3% 

4积的 95.6 % 1 
面积的 99.7 % 

图 1. 正态密度函.数. 


9( x ) 
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从定义及引理叫 推出： 0O) 由0单調上升到1，它的图形是 
一个 S 形的曲綫（如图2所示），且有 

少（一 x ') =1 一 0 ( x ), (1.6) 

表1給出当X取正数时少00的函数値 1 \而从 （1.6) 又可得出 

0 C — x \ 

在很多情況下，当X很大时，对“尾量” 1 一 ^ Cx ) 有一个初等 
的怙計是合宜的.下面将給出这个估計. 

引理2 1 2) . 当; t -> oo 时 


1 - 0 ( x } - i — e ~ i xt 

(2 丌 ) 吾 ; c 

更精确些說，对任意^〉0,下面的双重不等式 

-~-— e ~^ { -- — 1 < 1 一 0(*) < —-—— e~^ xt •— 

(2x)i U ㈤ 臺 x 


成立（紊看問題 1). 

鉦.用微分法我們可以驗証 


(2 丌）丟 


丄= 

X 





(1-7) 


( 1 . 8 ) 


(1.9) 


(1.9) 右边的被积函数大于 

1 — <P(ar) — —\ dy (1.10) 

(2 丌 )4 J* 


右边的被积函数.这就証明了 U.8) 中的第二个不等式.用同样 
的办法可証 （1.8) 的第一个不等式，只要另収一个新的被积函数 



一 *} 小于 4y ' 


术語 注解. 在数学文献中未語兮亨辱 i 譽就是指这样的非降函数 F (*) : 
当 r ——00 时 r ( j ：) 趙于 Q ， 而当 X —>00 时 F ( x ) 趋于 1. 統 計学家杷此函 


1) 至于更大的表，則請参看 〖51L 在那个表里当从0变到1时每隔 0.00UL 收一 
个分点，当1时則每隔 0.001 取一个分点，在这些分点上給出 0O) 与 
中 o) - 0(-x) 的値直到15位小数. 

2) 此处及以后符号“一皆表示菏边之比趋于1 , ’ 
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表 1. 正态分布 


t 

中 0 ) 

边 (/) 

t 

中 0 ) 


0.0 

0.398 942 

0.500 000 

2.5 

0.017 528 

0.993 790 

0,1 

0.396 952 

0,539 828 

2.6 

0.013 583 

0.995 339 

0.2 

0.391 043 

0.579 260 

2.7 

0.010 421 

0.996 533 

0.3 

0.381 388 

0.617 911 

2.8 

0.007 915 

0.997 445 

0.4 

0.368 270 

0.655 422 

2.9 

0.005 953 

0.998 134 

0.5 

0.352 065 

0.691 462 

3.0 

0.004 432 

C .998 650 

0.6 

0.333 225 

0.725 747 

3.1 

0.003 267 

0.999 032 

0,7 

0.312 254 

0.758 036 

3.2 

0.002 384 

0.999 313 

0.8 

0.289 692 

0.788 145 

3.3 

0.001 723 

0.999 517 

0.9 

0.266 085 

0.815 940 

S .4 

0.001 232 

0.999 663 

1.0 

0.241 971 

0.841 345 

3.5 

0.000 873 

0.999 767 

1.1 

0.217 852 

0.864 334 

3.6 

0.000 612 

0.999 841 

1.2 

0.194 186 

0.884 930 

3.7 

0.000 425 

0.999 892 

1.3 

0.171 369 

0.903 200 

3.8 

0.000 292 

0.999 928 

1.4 

0.149 727 

0.919 243 

3.9 

0.000 199 

0.999 952 

1.5 

0.129 518 

0.933 193 

4.0 

0.000 134 

0.999 968 

1.6 

0.110 921 

0.945 201 

4.1 

0.000 089 

0.999 979 

1.7 

0.094 049 

0.955 435 

4.2 

0.000 059 

0.999 987 

1.8 

0.078 950 

0.964 070 

4.3 

0.000 039 

0.999 991 

1.9 

0.065 616 

0.971 283 

4.4 

0.000 025 

0.999 995 

2.0 

0.053 991 

0.977 250 

4.5 

0.000 016 

0.999 997 

2.1 

0.043 9 B 4 

0.982 136 




2.2 

0.035 475 

0.986 097 




2.3 

0.028 327 

0.989 276 




2 - 4 

0.022 395 

0.991 802 





数常常喜欢叫作“累积分布函数”这一术語.其实“累积”这一形容詞是多余 
的.所謂密度函数就是这样的非負 函数： 其在整个 X 軸上的积分为1.任 
何密度函数从 一 00到 X 的积分是一个分布函数.旧术語“頻率函数”是密度 
函数的同义詞. 

止态分布函数常常也叫作“高斯分布 ” （Gaussian distribmioti ). 但是，在 
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高斯之先，德模佛和拉瞀拉斯就在槪率論中用过这个函数.如果改变坐标原 
点与究量单位，則可俾由卜）变为后者就叫作具有均値《及 
方差 P (或标准差卜|)的正态分布函数.函数 2 ^{ x 2 ^ 2 ) - 1常常叫作誤 
差函数. 


2- 德模佛-拉普拉斯极限定理 

令&表示成功槪率为 p 的》次伯努利試驗中成功的次数，于 
是 b ( Jc ， n ， p ) 就是事件“& =々”的槪率.实际上，我們感兴趣 
的往往是关于成功次数落在預定的范围《与 )8 之間的槪率.如果 
«，]8都是整数而且《 < )3,則此事件由不等式 a < < JS 所定 

义.而且它的槪率为 

P { a <5„<3} 

= i>(a; n, p) + b(_a + 1; w. p') + • - • +l>(n, p). (2.1) 

这个和数可能包括很多項，而直接計算往往是不容易办到的，然而 
幸运 的是： 当 N 相当大时，槪率 (2.1) 可用正态分布函数来簡单地 
逼近.这是德模佛 1〕 和拉普拉斯所发現的.我們将要看到，它的 
重要性要远远超出数値計算的范围. 

我們的第一个目的是要导出个別項 

Kk'- n, p) = nl p k g n ~ k ' (2.2) 

k\(n — 々）： 

的漸近公式.設:槪率 P 保持不变，而註 《 — 05. 根据大数定律[第 
六章（4. 2 )]，对于每■—个 e > 0, | S n — wp ! > ns 的槪率都趋于 
0,因此，只有滿足 k — — O 的々会成問題的.为了方便 

起見，引进新的变量 8 t = k _ np . 于是 

^ = np + n — I{ = nq — 3^- ( 2 . 3 ) 

而我們感兴趣的只是々的这样的 組合： 《 — 0 O 和 8 K !n -> 0. 


O Abraham DeMoivrc (1667 — 1754) • 他的丈章 [52 ] 发表于 1713, 
2) Pierre S. Laplace (1749—1827). 他的文章 [53 ] 发表于 1812. 
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把 (2.2) 中的因子用史特令公式表示，我們得到 》 


K 々 ; "， P) 〜 { 2 ^( n - 


nq 


v «— ^ 


12tt 々 (/z — J \ \ ^ \n 一 
n 1 i 1 


— i 27tin P + d — S k ) i np) np+ 、(l 一 d fj nqY 11 - 1 ^’ 

(2.4) 

其中符号“〜”表示两边之比趋于 1. 

为了計算最后一个分式，可先収其对数.在区間 I 心 i <« 河 
內可应用泰劳展式[第二章公式 (8.9)] ， 而其分母的对数为 

Qnp + 8^) log (1 -h djnp ) + {nq — ^) log(l — d K / nq )= 


{np + 8 ^ 


(告- 


d \ + si 


In 2 p 2 3 w 3 〆 


— + * 


— {. ticf — A,、l 






衫 I 


nq 3 n 3 q ^ 


+ 


•) - 

••)_ (2.5) 


按心的冪次整理一下，我們得 

^ A ( l ^+ L )- A . 

2 n V P q ) (> n 2 




+ 


2 npq ^ 3 pq « 


.}， 


( 2 . 6 ) 


其中 S \ l 2 npq 是主要項，因为 V «->0. 如果我們假定 S \/ n 2 -^0, 
則 （2.6) 中除了第一項外都趋于0,因此 (2.4) 可写成較簡单的形式 


Kk --, », 


户 ）〜< 


In^np + di，) Cnq — 


1 抓 pq , 


(2.7) 


然而 • + ^〜 nq — di 〜 nq , 因此 （2-7) 可以更进一步地 


0回忆一下，在第二章中我們幷沒有完全証明史特令公式，仅仅証明了 ：，卜 
cZ + if , 其中 C 为正旳常数.而在书中已假 定了： C = 欲証 C = 

需把( 2 _ 4 )，（ 2 . 7 ), ( 2 . 8 )中的因子（汾>用 C 来 代替. 这样，在 ( 2 . 川， 

(2.14) 和 （2.18) 的右边 就必須 要插进 C /(2? r ) i 这个因子.为了証明这个因 
子等于1，只要取 . r p 和 ■«•_« 都很大，則在修正了的方程 (2.18) 的右边可任意接 

近 C /(2^) S 而左边則接近于1 (参看■第六章第3节）. 
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簡化为 


b { k \, n , p ) 


{27mpcf}^ 


/ 2 * P 4 


-中 


3 t 


{npqY^ \npq)i / 


( 2 . 8 ) 


这就是我們所要求的漸近公式.我們可以采用一个較方便的 


符号把它加以簡化.令 


h = ---， （2.9) 

拌且定义变量々的函数以 如下： 

«* = (々一 np)h — . 8k (2.10) 

( npq ~)^ 

利用这些符号，我們可以把 （2.8) 写为 

Kk '-, n , p ) ~ h 今 ixQ . (2.11) 

在这个式子的推导中，我們假定了 《 — 和 OO 满足 
一 1 — 0和 8\ n ~ 2 -> 0. 显然，最后一个条件蘊含了前面一个条 
件，而且它們等价于 x \ n~i ^ 0 . 因此我們有 

定理 1. 如果 《 — 00和 OO 以—0的方式变化， 
則漸近公式 （2.11) 成立.更精确 地說： 我們証明了存在常数3和 
/ H 吏得 


I 〆 々； w ，户 ) _ j < 兰 + 14 I 

' 钟 （ A ) n 10 - 


( 2 . 12 ) 


((2.11) 的另一形式参看間題19和 21). 

图3对 n = 10, #> = 0.2 而只是 1.6 的情形来解释这个 
定理，可以看到卽使在这样极端不利的情形下，逼近的程度还是很 
好 1 \ 

由我們的定理直接导出和数 （2.1) 的一个簡易的近似式.如 
果 

hx \ 0, hx \ —* 0, (2.13) 


1) 当々= 0, 1,2, 6时 ，对 应的^ :々；10, 0.2) 的値分别为 0.1074, 0.2684, 

0.3020, 0.2013, 0.0880, 0.0264, 0.0055; 而对应 的近贝 式 的値分別 

为0.0904, 0.2307, 0.3154, 0.2307, 0.0904,0.0189, 0.0021. 
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10 次伯努利試驗中々次成功的槪率 6 (々；1 U ， ±).而那条連續曲綫 
則表示对于每个整数々所对应的正态逼近. 


則对 （2.1) 中的所有各項， （2 JL 1) 都一致地成立.因此 

P{a<S B <)S} 〜力 { 令 ( 尤 《) + ^>(^a+i) + + 佘 (^)}. (2.14) 

右端为一个积分近似式的黎曼和 1 >，我們現在来硏究其逼近的精确 

性. 

由中値定理我們知道，存在一个心使 

A —丄 A < < 々 + 丄 (2.15) 

2 2 

因此 

= ^l~ x i ) {^{x^+x') — 0{x^x}}^ (2.16) 

1) 显然，由 ( q + i )— 金 Oc 卜0 表示区間 ( AT 々— ~ h 9 x ^ + -— A ) 上曲纔 V = 0 Oc ) 
下面的面积，表示同一区間 J ： 对应的矩形的固积. 
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选取任意一个 s > 0. 如果 （2.13) 成立，則对全部《 <々 < )3 和 
充分大的 n 都有 

lf |— ^ I 1^ — **| • + A ：^ I <A 1^1 - V—h < s , 

2 2 L 4 J 

因此 

e ~ s { 0 ( x /{+^) — 0(% 々一 吾）} < < 

<e e {<P(.x k+ x) - (2.17) 

对々求和，我們发現 （2.14) 的右边与 OKy+y - Hxa - x ) 之比趋 
于 0. 因此，我們 証明了 

德 棋佛- 拉普拉斯极限定理. 如果《, 3依照 Ad —0,及 
hx \ -> 0的方式变化， Ml ! 

P {« < S „ < 則〜 0( x ^+^) — 0( x a -^). (2.18) 

其中 h = { npqy ^, x t = it — np ^ h . 換言之 ，（2.18) 两揣之相对 
誤差随 k |， 的趋于零而趋于零. 

特別，若限制《和 )3 的値，使得对应的〜与;^落在某一固定 
的区間內，則 （ 2.18) 成立.（对《和|3之取値相当大以致条件 
(2.13) 不能滿足的情形，将在第 5 节及問題 14 中討論 .） 

在統計学中应用 （2.18) 时，通常是令《及 )3 取这样的値，使得 
k „| 及|外|的値不超过3或 4. 然而在理論上应用 （2.18) 时，往 
往要使区間 （《, ；3)远离二項分布的中心部分，这时对应的^ 
都很大.这时 （2.18) 的两边都很小.因此去了解它們之比是否接 
近1，与它們的差趋于零是同等的重要的. 

如果我們引进“正則化成功次数” 

Sn — n f (2.19) 

( npq )^ 

来代替 S „， 則极限定理 （2.18) 会变得更加簡单. SJ 卽为用 
作单位去度量 S „ 与之偏离•数称为 S „ 的， f |，（ npg )* 称 
为 s „ 的辱窄#.用这述語是由随机变量的理論 ¥ 所提示出来的 
(参看第 i 章）.不等式《 < S „ <)3 与心 < <邛表示同样的 

事件，所以对任意固定的< w ，(2.18) 可以表成 
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P{^a SJ ^ Xp} ~ + 音 )— 0^Xa — 含 )’ (2.20) 

其中 A = (npq)i, 但当 》 — »■ 00 时 A — 0, 所以右边趋于 ^>(xp) 
—< Kh ). 于是我們得到 

极限定理的推論. 对每一組固定的 a < b , 都有 

P{a ^ ^ 少(办）一少 (a). (2.21) 

这是 (2.18) 的一个較弱的形式，然而它却是拉普拉斯极限定理的 

一个传銃的形式.如果略去 (2.20) 中的微量則带来的誤差随 

2 

« — oo 而趋于 U. 但是当 w 柯不太大的时候（如例 (3.a) — (c)), 它 
却有着重大影响. 

(2.21) 所說明的主要事 实是： 对于相当大的《，左边的槪率在 
实际上与 P 无关.这就可以使我們用标准的尺度去比較各組不间 
伯努利試驗序列的起伏. 

定理 （2.21) 在历史上是槪率的第一个极限定理.从近代的覌点来看， 
它仅仅是中心极限定理的一个非常特殊的情形.关于中心极限定理将在第 
十章中研究，而其最一般的推导則耍推迟到第二卷.統計学家甚至对相 
当小 吋还用 (2.21) 来作逼近，这吋就需要估計誤差，在許多情形下， (2.11) 
的誤差比在 (2.14) 中和数用积分来代替时所产生的誤差耍小(幸好，可以用 
尤拉-麦克劳林 （Kuler-MacLiiurin ) 求和公式避免后一誤差).塞格•伯因 
斯坦发表了許多論文来硏究在一般情况下的誤差，幷討論了如何修改々的 
定义以便使 U. is) 的收斂性得到改善.他的論文都是用俄文发表的，而 a 不 
容易得到.但是他的結果的改进的簡化推导，己經有了英文文献 15 

关于任意傳止的附注. 必須 注意： 我們的极限定理和逼近 
定埤只有当試驗次数《不依賴試驗的結果而事先固定时才是对 
的.如果一个賭徒有权在对他有利的时刻停止賭博，則他的最終 
贏得不能由正态逼近来判断，因为这时賭博的持續时間是随机的. 
对于每一个固定的„来說， S ? 很大的可能性很小.然而，在一个 
长的連貫中，甚至不太可能的事件也可能发生，而且我們将要看 
到： 在一場持續的賭博中， s 》 在实际上确有一序列极大値其阶为 
(log log«)i- (:这 就是第八章第 5 节的迭对数法則）. 


• 179 • 



3 .例 

(a) 令#> =丄， = 200, a = 95, 0 = 105, 在这神情形下， 

2 

P{95 105} 可以解释为把一个錢市扔 200 次出現正面的 

次数与 100 之偏差不超过 5 的槪率.我們有 h = (50)~ 1/2 = 
0.141421. •.和 = x p+i = (5.5) h = 0.7778 •- - . 查表卽得 

<P(^ p+ i)-<P(^_i) = 0.56331- - •. 眞正的値（也是由查表而得的） 
是 0.56325〃，. 这个誤差小得惊人，这是因为在我們这个問題所 
考虑的区間中，积分是 (2.14) 中和数的高估計，而 （2.11) 又是对每 
一項的低估計. 

( b ) 令 p =丄， /z = 500, a = 50, |8 = 55. 正确的値 P{50< 

10 

S „ < 55} = 0.317573- - - . 但是 6 = (45)—*=0.1490712. • •，可得 
出近似値 < f (5.5^) - <2>(-0.5/4) = 0.3235 • • •. 其誤差大約为百 
分之二. 


表 2 .对 n =100, p =0.3 的二項分布与芷态逼近的比較轰 


成功次数 

槪 率 

正态逼近 

相对誤差 

9< S „<11 

0,000 006 

0.000 03 

+ 400 


0.000 15 

0.000 33 

+ 100 

15^ S „^17 

0.002 01 , 

0.002 83 

+ 40 

18< S „<20 

0.014 30 

0.015 99 

+ 12 

21^ S „^23 

0.059 07 

0.058 95 

0 

24^ S „<26 

0. H 8 87 

0.144 47 

-3 

27^ S „^29 

0.237 94 

0.234 05 

-2 

34^ S „<36 

37< S n <39 

0.230 13 

0.140 86 

0.058 89 

0.234 05 

0. H 4 47 

0.058 95 

+2 

+3 

0 


0.017 02 

0.015 99 

-6 

43< S „<45 

0.003 43 

0.002 83 

-18 

46^ S „^4 S 

0.000 49 

1 0.000 33 

-33 

49^ S „^51 

0.000 05 

0.000 03 

-40 
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Cc ) 令 》= LOO , p = 0.3. 表 2 以一个典型的例子（对相对 
地較小的 》) 說 明：当 （《，⑴远离中心項时正态逼近怎样地在变 

坏. 

(d) th 我們找寻这样的一个数《，使得对于相当大的 ”由不 
等式>«所确定的事件具有接近于+的槪率，为此必需 

-0>(- a ) =丄，或者$00 = 从正态分布表中可以找 

2 4 

到《 = 0.6745, 因此两个不等式 

( S „ — I < 0 . 6745 ( npq )^, 

! S„ — I > 0.6745(npq)^ (3.1) 

的可能性大体上是相等的.特別，把一个錢 币扔” 次出現“正面” 

的次数落在区間[二一 0.337»^, — + 0.337»^ 1內的槪率大約为 

L 2 2 J 

1/2. 同理，把一顆殺子擲《次，出現“么点”的次数落在区間 

[—— 0.251«^, — + 0.251»^內的槪率大約也是丄 . S 。 落在区 
l 6 6 」 2 

間[即一 2{np q y^, np + 2(叩《)*]內之槪率約为 < P (2) - 0(-2) 

— 0.9545 • • • ;若把区如改为 [郎 一 3 ( npq ) i , np 4- 3(» pg )*] ，則 

对应的槪率为 0.9973- 

( e ) 7 个孝 f 嚼寧，这是說明公式（ 2 . 2 1 )的实际应用的一 
个例子. ikin — i 杉礎之間有两条竞爭的鉄路，屯們的火車 
是同时开出同时到达幷且具有同样的設备.假定”个旅客乘坐哪 
—条鉄路的火車的选择是互相独立的而且又是任意的，于是每列 

火車的乘客数目可視为以槪率？=丄的》次伯努利試驗的結果. 

2 

如果一列火車設置个座位，那么，一旦有多于 J 个旅客要来 
乘車，就容納不下了.令这个事件的发生槪率为 / G )， 且 f 0)> o , 
应用漸近公式 C 2.2 L ) 就有 

fW=^l - (3.2) 

、 n 气 7 

如果，是如此的大，以致< 0.01，那么在 loo 次中有 " 次是 
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有足够的座位的.一般說来，公司可以任意規定一个冒险水准《 
幷这样来决定 V 使 /( y ) < «. 为此，只要令 

y ^ — (« + (3.3) 

2 

其中心是方程《 = 1 — 屯 ( J 。) 的根，可在表中查得.例如若》= 
1000, a = 0.01, 則 G &2.33, 而5 = 537个座位就足够了.如果 
两条鉄路都規定冒险水准为《 = 0.01, 則两列火車所有的座位的 
总数为1074,其中有74个空座位.可見由于竞爭(或者机会的波 
动)而带来的損失是很小的.用同样的方法可算出，若有514个座 
位則在80%的情洗下是够的;而若有549个座位，則在999/1000 
的情现下是够的. 

类似的考虑可以应用到其屯的有竞爭的供应問題上去，例如 
对〃位顾客有/"个电影院来竞爭，于是每个电影院成功的槪率是 

P =丄，而 （3-3) 应該用 J + t a n^(m — 1) 士]来代替.这 

m \m ! 

时空座位的总数約为— n ^ t a n ^ {m — 1)^. .当 a = 0.01, 
n = 1000, m = 2, 3, 4时，空座位的数目大約分別为74, 126, 
147. 由于竞爭而带来的使用率的損失是非常小的. 

(0 随机数字.在第二章例 （3. b ) 中，曾經考虑具有 p = 

♦ 鲁 ♦鲁 

0.3024 的事件，在 n = 1200次試驗中，这个事件的平均頻率为 
0.3142, 它与 P 的离差为 S = 0.0118. 在这里， ipq )^ = 0.45^3, 

e («/^)^^0.890- - •. 因此 " — p > s 的槪率大約为0.37_ - •， 

n 

它說明大約占总情況的37%成功的平均数与 P 之偏差大于 s . 

( g ) 在某一 m 居民中，吸烟的人的比数为 p . 假定夕是 

未知数而放回的随机柚样来决定 P ， 要求其誤差不超过 0.005. 
为此样本的大小《究覚要多大呢？如果 〆 为（柚出来的）样本中 
吸烟人的比数，我們希望丨 〆 一 ？| < 0.005. 但是不論样本有多 
大，总不能絕对地 保証： | 〆 一川 <0.00=5: 样本中人人吸烟也是 
可以設想的，因为絕对的必然是不可能达到的.我們取一个“®信 
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水准” ct , 比方說：《 = 0.95, 卽要求 I〆 一 H < 0-005 的槪率大 
于等于 0.95. 注意：邛 '是 ”次試 驗成功的总数，因此 

P{\p — Pi < 0.005} = p| ^ — p C 0.005|. 

我們求〃要足够大，使得上列的槪率大于 0.95. 为此，只要利用正 
态逼近就成了. 方程 0{ x ) — 0 C — X ) = 0.95 的根 r 等于 1.96 

.•- ，因而有 0.005 (―V > 1.96- 卽》> (392 ) 2 W , 或近似地 

W 

« ^ 160,000 p ^. 疼个不等式虽然依賴于未知量〜而舛决不起 

过丄，因此样本的大小取作 n = 40,000时，則在一切情形下郡可 

4 

以了；而且 I〆 _ p | < 0.005 成功的机会19倍于失敗. 

4. 与普阿松逼近的关系 

当 n 河相当大时，正态逼近的誤差很小.另一方面，当；》大而 
P 小时，則 b { k \ n , p ) 将接近于 A =邛的普阿松槪率 pOd 
如果 A 很小，那就只能用普阿松逼近了.然而当 A 較大时，則正态 
逼近与普阿松逼近都可以应用.由此可知，对 A 較大的値,就可能 
用正态分布去逼近普阿松分布，且在第十章例 （1. C ) 中我們将看 
到确实如此(也可参看問題 9). 但在这里，我們只用一个数値的例 
子和一个实际的例子来說明这一点. 

例 .（ a ) 考虑普阿松分布 〆 々； 100) .我們可以用它来逼近一 
个具有》= 100,000,000, p = 1/1,000,000的二項分布.此时 
npq ^ im , 虽然这个量幷不大，但至少在二項分布的中心部分可 
以用正态分布来很好地逼近它.普阿松分布？(々;100)与 〆 々； 
10 8 , 10- 6 ) 的前面好几位小数是相同的，可以把它和后者的近似正 
态分布来作比較.为簡单起見，令 P { a , b ~) == p ( a ； 100) + p{a + 
1; 100)+ •• • + pib ~, 100)， 于是， P { a , b '} 替代了 P{a < S „ d >} ， 
而且可用 

0 (±—^ - a , ( A : 严 g ) 
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来近似.下面几个数字給出逼近程度的輪廓. 



正确的値 

正态逼近 

P (85,90) 

0*113 ^ 

0.110 49 

P (90,95) 

0.184 85 

0.179 50 

F (95,105) 

0.417 63 

0.417 68 

P (90,110) 

0.706 52 

0.706 28 

P (110,115) 

0.107 38 

0.110 49 

P (115,120) 

0.053 23 

0.053 35 


( b ) 夸辱•聲喂寧.下面的問題是从实践中經过一些簡化 
以后提出'一* V 电話交 換台/ 为靠近于交換台 S 的 2 000个 
用戶服务.如果从 j 到 s 安装2000条綫路，那就太貴太浪費了. 
我們只要安装的綫路的数目 AT 是如此大，使得在通常情形下，100 
次呼喚至多只有1次不能立刻接通.假定在一天最忙的时間里每 
个用戶打到 S 区去的电話在一点钟內平均占綫两分钟.不妨把最 

忙碌的时間里的一个固定时刻的情況比拟为 p = i 的 2000 次試 

驗 ，其中 P =丄表示每戶用綫的槪率.在通常的情況下，这些試 
30 

驗可視为 相互独 立的.（这幷不总是正确的.如果由于意外的大 
雨或地震，很多人都要叫出租汽車或本地报館的电話，綫路 就会发 
生“拥挤”，那时，独立性的理論就不能用了. ） 因而就得到了具有槪 

率#» =丄的2000次伯努利試驗，求滿足下面的条件的最小的設 
30 

e 綫路数目 AT ,使得“成功” 的次数 （ 卽占綫的数目）超过 ZV 的槪 
率小于0.01，用記号 表示： PIS .000 ^ N } < 0.01. 

对普阿松逼近来說，取 A = 200/3〜 66.67. 查表可得，成功 
次数大于等于87的槪率約为 0.0097, 然而成功欠数大于等于8 6 
的槪率約为 0.013. 由此可見安装87条綫路就足 够了.对 正态逼 
近来說我們首先要找出方程1 _0>0) == 0.01 的根; c ， 由查表可 

1) 参看 [55]. 在該书中此問題是用普阿松方法来处理的，工程师总是喜欢用飪阿 
松方法 • 
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得. r = 2.327. 于是我們 要求： (AT — 含一印) /(« W fe 2.327. 

由 f " » = 2000, p = 1/30,所以 2 V > 67.17 + (2.327)(8.027) 〜 
8^.8. 因此，使用正态逼近法的結 果是： 只需安装86条綫路就足 
够了. 

这 两个解答可以說是一致的.这种方法还可以給出另外一些 
有用处的結果.可以这样 設想： 把2000个用戶分成两組,每組各 
1000戶，从 J 到 B 的綫路也与之对应地分成两組来安装.用上述 
方法算一算結果还要多置10条綫路，因此第一种安装法还是更好 
一 些 


5.大偏差 1 > 

我們常常要估計“正則化的成功次数 sr (參看 (2.19)) 大于 
某个給定的数値^的槪率.这时区間的上端是无穷大，因此需要 
做一些特殊的論証来說明我們的极限定理 (2-18) 仍旧适用. 

定理. 当》— oo 时若 * 作为》的一个函数而变化，使得 
x —>■ oo , x 3 h — > 0貝 IJ • 

P{S?>*} - 1 (5.1) 

由 （1.7)，（5.1.) 等价于 

P { S ? > x ) --- (5.2) 

鉦，在 （2.1 8 ) 中选取整数《， JB ， 使 X 落在〜与 Xa + l 之間 ，同 
时 4- log x m 于是 x\h 0 从而 （2.18) 成立.因此 

P{a < S„ < jB} 〜 {l — <P(^a)} — {l — 少 ( 外 ）}. (5.3) 

然而从 （1,7) 及 a 〜 + log a 容易看出： 1 —<&(外）的数量級 
比 J — 0( Vd ) 要小，同时1 一 ^( Xa ) 〜1 —少 00. 所以 

P{ct < S „ < j 8} 〜1 — 巾 （ x \ (5.4) 


I )本节中的定理具有多方面的意义，然而在本书中 R 有在第八章第5节中关于迭 
对数法則的証明中才用到它. 
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另一方面.从 (2.11) 及第六章公式 （3.5) 我們有 

P { S „ > 戶} < ---- b (3' n ， p ) 〜^- 中(外). (5.5) 

p - np Xfi 

因为= l/pq 是一个常数，幷且 

—~ 1 — < P ( X 0), ( 5.6) 

我們 E 經看到，右边趋于零的速度較1 — <500为快，这就意味着 
P{S„ ^ J 3} 的数量級要比1 一 0( r ) 还耍小.把这些結果与 (5.4) 
結合起来，則得 

P{S„ > ct } 〜 1 一 < P ( a ) , (5.7) 

这就是我們要想証明的定理 .（ 关干大偏差的另外一些极限定理将 
在問題 12— 17中給出 .） 


6.間 题 


】•推广（】.8)，証明: 


1 — 0 ( x ) ^ 


(2^ 




1.3-5 


+ 




+ (-1)之 


1 .3 …（2々一 1) 


}， 


( 6 . 1 ) 


且当 * > 0时，若々为偶数則 （6.1) 之右端髙估_/ 1 一 <Hv); 若々为杳数則 
(6.1) 右端低估了 1 —牵卜）. 

2.对于每个常数 a > 0 ,当 * —>00时 

|l - - 0(x)}^~ a . (6.2) 


3.求出10,000个随机数字中，数字7出現的次数不多于968次的槪率. 

4 .把一顆殷子，連績 * 12,000 次，求出現“么点”的次数在1 叫 0与21^0 
之間的槪率的近似値. 

5 •求一个数々，使得扔1000次錢币出規“正面”的次数在 M 0 与々之間 
的槪率約为 0.5. 

6 .为了求出女性居民在居民中所占的比数/,进行抽样調査，問样本要取 
多大方能使抽样誤差小于 0.005 的槪率大于等于 0.99? 

7 •—个錢币扔了 10,000次，出 I 見了 5400次“正而”，我們是否能够断言 
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这个錢币不均匀呢？ 

8 •求三項分布 


n ! 

々！ r !(» — 々 一 0, 

中最大項的近似値， 


p\ P 2 {1 - Pi — PzY-^ ■- r 


^ - f 1 利用史特令公式証明：如果2—00,則对 

于任意 '''' 

^ X , /(々;又) —® (戸 ） 一 ®( a ). (6.3) 

l + a ^<， t < A + p ^ 

10 •超 几何分布的 IE 态逼近.令％ »，々为芷整数且假定 

r n m ，广 ，飞 . . 

--- w ， --- 、 p ， ―-- 叫 ， — rp)-^x (6.4) 

n -\- m n m n m 


其中 l/A = (» + m ) pqt (\ - /) j . 試証: 




— h < f >( x ) • 


(6.5) 


提示： 用二項分布的正态逼近比用史特令公式好. 

11 ■平 夸兮亨孕 M 今荜寧1 56] .在第二章 ( li . i 9 ) 中我們看到 ，在” 个《 
与 m 个0的•排•列 •中 •，4淪連貫的槪率为 




令„—00, m -^ co , 丼設( 6 - 4 )成立.对于固定的 a < p , a 連貫的个数落在 


n P c i + a ( npi})T 与 npq + 戶 （《 P ?) 了之間的槪率趋于企 （ P ) — ®( a ). 

在下面的問題中， f > 2 = npq , SJ 是 （2.19) 所定义的“正則化的成功次 
数’，.而 


Pn { x ) = P { S ；>*}. 
12 .若 X 作为 n 的函数而变化，使得 


則【切 


x ^ + a h —^0^ r —>00 ? 


F n( x ) 

1 — 少⑷ 


+ °(— )， 


(6.7) 


( 6 . 8 ) 


其中代表数量級比 M 小的量. 

13•若七~>0， 0 O . 則 I 58 】对于任意常数。>0,有 
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/ (龙 + +) -/U) — 0 ， (6.14) 

a 有 

f »( y ) — ®( r )}. (6.15) 

16 . 在只假定 0 的条件下，由 （6.15) 推出 （6.9). 

17 . 若 P > q , 則对于相当大的 r 

P{S„<;r}<P(S〆 一 *} (6.16) 

(提 示： 应用問題 14). 

1 8 _木学苹呼:哼丁个葶準 f . 試証大数定律可由®模佛-拉普拉斯极限 
定理推出. 
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19 .正态逼近的一个新推导 1 \ 从第六章 （10.11) — （10.13) 出发，証 


明：当《— CO 和々—00滿足0时,我們有 

k 々； ”， p) 一 ( m ; ”， pm 

20.如果 np ^ m^{n + i ) p 7 証明： 


(6.17) 


(”】;》， : n ， p ) 《 厶 ( m ; n ，(6.18) 


如果 （》+ 同样的不等式仍然成立，只不过把最左边的 

^4-代之以- /(» + 1) 罢了. 

»十1 

21 •推出 b { m \ nyp )^{2 K{n -f 1 ) M ) _ 丁，幷轉出 JL 界和下界. 


1) 問題19和20加在一起薇含•了 b ( JC ，， p )~{(« + 这和基才 

的逼近公式 （2.11) 是一样的，只不过以6代 M ， 以友=+ i ) mF ^ 代 

h = { npqyi . 因为和 々~ A‘， 所以两个公式是漸近等价的.实际上，新 
公式的誤差項比較小.（在它的推导中，由（ 2 -7)到 (2.8) 的誤差可以避免 .） 还 
須注意的是：問題I 9 和20所需要的計算比課文中所需要的更簡单更直現；它 
們只包含如第二章第 8 节和第六章第3节所用过的关于对数的标准诂計.簡 
短地說，新公式及其推导都比課文中对应的公式及推导較为优越， K 是它們不 
符合于长期以来采用的印而代以（”十1>. 
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* 第八章伯努利試驗的无穷序列 


本章所討論的是关于伯努利試驗的随机性的某些性貭，及关 
于它的重要的迭对数法則.伯努利試驗的起伏理論(至少对？=+) 
的一个不同的方面 B 包含在第三章中. 

1. 試驗的无穷序列 

在前一章中我們已經詳細地討論了关于~次伯努利試驗的槪 
率，同时也硏究了当 n — 00时，它們的漸近性眞.現在我們轉而 
硏究一类更为一般的問題，其中事件本身在有限的样本空間中幷 
不能定义. 

例.了个亭 K 舉寧.令《， JB 为两个正整数，我們考虑一个 
潛在的伯努的无穷序列，譬如扔一个錢币或者擲一顆骰子. 
設想甲与乙打这样一 个賭： 如果接連成功《次的連貫发生在接連 
失敗 j 8 次的連貫之前，就算甲贏.“甲贏”这个事件的槪率，它的直 
覌意义是很淸楚的，但是要記住，在数学理論中事件这个术語是代 
表“样本点的集合’’的，它只有在适当地定义了样本空間之后才有 
意义.为此，伯努利試驗的有限次 C 設” 次)模型对我們現在的情 
形来說就不够了.但这个困难只需用簡单的取极限的办法就可以 
解决.在》次試驗以后，甲或則获胜或則失敗，或者不分胜負.令 
对应的槪率分別为 〜， h + y B + ^ = 1). 当試驗的次 
数》增加时，不分胜負的槪率〜只能下降，而〜及—定上升. 
因此 x = limar B , y = limy „, s = limr „ —■定存在.不会有人迟 

n-*oo n —co a >*03 

疑而把 h y ， z 称为甲最后获胜、失敗或胜負不分的槪率.然而， 


♦ 标有屋号的这一章与以后各章題材无直接联系，初讀时可以 略去. 
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对应的三个事件只能定义在試驗的无穷序刻所成的样本空間中， 
而且这个空間幷不是离散的. 

达个例子的引进仅仅为了說明問題，至 于〜， 4的数値究竟是多少 
不是我們当前所关心的.在第十三章冽 （8. b ) 中可以計算它們.然而有一个 
比較簡单方法可以算出极限； t , y , S , 这个方法在更一般的場合也可以应用. 
由于这个方法重要，而且很有意思，我們現在就来餅一餅. 

令 J 表示“接連成功 a 次的連貫的发生在接連失敗芦次的連貫以前”这 
一事件.于是 J 意味着甲获胜，而 ；r = P{>) •令 《，r 分別表示在“第一次 
試驗之結果为成功”或“失敗”的条件下事件 J 的条件槪率.于是 x = pu + q 0 
[第五章 （ 1 . 8 )]. 首先設第一次試驗的結果为成功.于是事件 /可以 有下面 
a 种互不相容的方式发生，分为二类来 推述： （ 1 ) 紧接在后面的 a— 1 次試 
驗的結果都是成功，其对应的槪率为 P a_1 . ( 2 ) 第一次失敗发生在第 V 次試 
榦.其中 2 <v<a. 令这一事件为于是而 1 *(^%)=^. 
因此(再度应用复合槪率公式） 

« = p a ~ l + 狀（1 十 f + ..• + P a_2 ) = #> a_1 十* <1 — #> a_1 ). (1.1) 

在第一次試驗的結果为失敗的情形下，用类似的討論可以得到 

V = pu(l + q + -+ q^~ 2 ) = “（1 — . (i .2) 

这样一来，我們得到了关于未知数 u,v 的两个綫性方程，解出《, 〃后再用 


x = pu + qv , 6 P # 


x = p 3 — 1 


1 _ I? 戶 

P^ 1 + 9 P_1 — p a_1 9f i '" 1 


(1.3) 


至于求 y 之計算，只須把 （1.3) 中之 P 与？；《与/3 之位置相互对換卽可，于是 


y = 


_1 - p a _ 

p a-l + qt i-l _ 


(1.0 


由于 . v - + y = 1, 所以 2 = 0, 卽是說胜負不分的槪率为 0 . 

例如： 扔一个錢币 (P = j )， 出現两次“正面”的連貫在出現三次“反面” 

的連貫之前的槪率是 0.7； 接連出現两次“正面”在接連出現四次“反面”之前 
的槪率是5/6;接連出現三次“正面”在接蓮出現四次“反面”之前的槪率为 
15/22. 在德歡子吋，接連出現二次么点在接連出現五次非么点之前的槪率 
是0.1753,等等. 

在这一卷书里我們只限于討論离散的样本空間的理論，这就 
大大地損害了数学理論的完美性.在一般理論中 ，把〃 次伯努利 
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試驗仅仅作为一个无穷試驗序列的起头的一部分来考虑.因而一 
个样本点是由字母 5( 成功）和 f (失敗）的一个无穷序刿来代表， 
而样本空間就是所有这样的序列的总体.一个有限序列譬如說 
它表示最初四次試驗分別为 S , S , F , S 的那些样本点的总 
体.在无穷的样本空間里，上面关于賭博的那个例子不需要用板 
限过程就能說明了.任取一点，也就是一个序列 • SSFSFF "、 在 
它里面，由接連《个5所构成的連貫可以出現，也可以不出現，如 
果出現的話，那未在这以前，也可以出現过“接連 JB 个 F 所构成的 
連貫”,也可以沒有.这样一来，所有的样本点可以分为三类分別 
表示 事件： “甲获胜”，“甲失敗”，“不分胜負”，它們的槪率就是上 
面算出来的： tr ， y , A 在这个样本空間中唯一令人苦恼 的是： 它 
不是离散的样本空間，而我們对一般样本空間的槪率又泫有定义. 

請注意，我們所討論的其实幷不是眞困难，而是一个术語的問 
題.拿我們的例子来說，問題不在于数 f 的定义下得适当不适当， 
及对沱的解释給的正确不正确，問題仅仅在于，为了避免自相矛 
盾，我們要么把工說成是“在》次試驗中甲赢的槪率的极限”， 
要么把它說成是“甲贏”的槪率，而样本空間不是离散的.我們打 
算两种办法都用.为了語言的簡短，我們使用事件这一术語，卽使 
它們是定义在无穷的样本空 間中； 为了理論的精确，叙述定理时将 
要先用有穷的样本空間，然后过渡到极限.这一章里所硏究的事件 
都具有上述例子的如下的特色. “ 甲获胜”这一事件虽然是定又在 
无穷的样本空間中的，但它可表为“甲 在第” 次試驗获胜” (《 = 1， 
2, •…）的那些事件的幷，它們中的每一个只依賴于有限次試驗. 
我們所要求的 r 是单調序列&的极限，这些槪率&只依賴于有 
限次試驗.我們幷不需要比《次伯努利試驗模型的理論更高的理 
論； 我們只不过簡化了累贅的表达 1 >，把本来是“槪率的极限”的一 

O 如臬讀者对一般測度論較熱悉的話，那么这个情形可以搭述如下.我們仅仅考 
虡这样一些事件；或者它只依賴于有限次試驗，或者它只是这类事件的单調序 
列的 极限. 我們計算这些明显的槪率的极限，显然这井不需要測度論.然而 R 
- 有在测度論里才能証明：这样的极限値不依賴于特殊的取极限的过程而且是 
完全可加的. 
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些数目叫作槪率. 

2. 賭博的长策 

很多賭徒的慘痛經历使我們得到这样一个 教訓： 沒有一种賭 
博长策能成功地改善賭徒的机遇.如果漑率論正确反映生活的 
話，这个經驗就应該对应于一个可以証明的命題. 

为了确定起見， a 我們考虑一个潛在的伯努利試驗的无穷序 
列，而且假定在每一次試驗中賭徒都有选择睹或者不賭的自由. 
所謂賭博的“长策”，就是賭徒事先制定的一套規則，来决定哪一次 
該賭.例如，賭徒可以决定在每个第七次上賭，或者在賭一次之 
后，再出現七次“正面”之后 的那一 次賭.他也可以只在“正面”連 
續出現13次以后 才賭; 或者在第一次“正面”出現以后賭第一次，然 
后在头一回連續出現两次“正面”以后睹第二次 ，一 般地，在連續出 
現々次“正面”以后就賭第 々次. 在最后一种情祝，他賭的頻次将 
是越来越少的.我們幷不需要考虑个別試驗的賭注；我們将要証 
明沒有一个“长策”可以改变賭徒的处境，他們所得到的結果和每 
次都賭是一样的.不言而喩，只能在通常意义下的“长策”，卽在賭 
徒不知未来的情況下才能証明这个命題.（至于眞正的未卜先知 
存在与否的問題幷不是我們所关心的 .） 同时，象“輸了三次以后便 
回家”这类規則是可能改变賭徒的处境的，不过这些沒意思的长策 
我們把它除外. 

长策的定又是一套規則，按照这套規則，賭徒在无論哪一次 
上，唯一地决定他是参加賭还是不参加賭.在第 々次 試驗上，他的 
决策可以依賴于以前的々_ 1次試驗的結果，但是不可以依賴于 
第々，々+ 1,々+ 2, •… 次試驗 結果； 最后，这些規則还要求能够 
保証： 賭博可以无穷的継續进行下去.因为規則是固定的，所以 
“在” 次試驗中賭徒参加賭的次数超过次”的事件是有定义的， 
而屯的槪率是可以計算出来的.上面定义里的最后的条件要求对 
任何一个 r ，当 0 O 时这个槪率趋于1 . 

我們的基本定 理是： 无論长策是什么，賭徒参加賭博的那些 
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次試驗組成一个伯努利試驗序列其成功槪率不变.如果在措詞方 
面做适当的修改,这个定理对一切类型的独立試驗都 成立； 在任何 
情況下，进行賭博的那些次試驗都是原来試驗的一模一样的仿制 
品，所以沒有一个长策可以改变賭徒的运气.这个命題的重要性 
首先由馮•米賽斯所发現.他把庀作为基本公理而引进，卽所謂 
有效的賭博长策的不可能性.这里的陈述及証明都是引用杜勃 [591 

的.为了簡单起見，我們假定/> = —. 

2 

令4表示“第一次賭博发生在第々次試驗”这一事件.长策 
的定义耍 求：当 》-> ①时，在第》次試驗以前进行第一次賭博 
的槪率趋于 1. 也就是 ?{/<!> + P{^ 2 } 4- • • • + P{A k } » 1, 
或 

XP {4} = 1. (2.1) 

其次，令心表示“第々次试验出正面”的事件.于是“第一次参加 
賭的那次試驗 里出現 正面”的事件 S 是事件 乂仏， A 2 B 2 , A 3 B 3 , - - - 
的幷，而这些事件是互斥的.因为只依賴于最初々 一 1次試 
驗的結果，只依賴于第々次試驗，所以及是相互独 

立的，从而 = P{A k }P{B k } = IP {小 } .故 P {5} = 

2 

=~ ZP { a k ]=—. 这就說明在这个长策下第一次 
2 2 

賭博中出現“正面”的槪率为丄，同理,对于以后的各次賭博，这个 

2 

結果也成立. 

还要証明 的是： 要賭的那一串試驗是独立的.这就意味着在 

第一第二两次賭博中錢币都出現“正面”的槪率为丄（以此类推到 

4 

其它的耝合以及此后的試驗）.为了驗証这个論断，令表示“第 
二次打賭在第々次試驗”的事件.令万表示“头两次賭博都出現 
‘正面 a 的事件，£是一切事件 AiB ； AtB k 的幷，这里 ；•< 々（如 
/ >々，貝 IJ 木，互斥，从而 AiAt =0). 因此 
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PU} 。 Xi Z ( 2 . 2 ) 

k = i+l 

同样，我們可以看出，对固定的/，々>;，事件以（“第々次試驗 
出現正面”）与事件為.5 〆 ？（它仅依賴于最初々一 1次試驗的結 
果）是相互独立的.因此 

P {£"} = + ) 

2 i=\ i+l 

- 1- ^ P{A,B,} ^ PiA^lAiB,-} (2.3) 

-f l 々 =f 十】 

[泰看第五章 （1.8)]. 但是，不管第一次賭是在哪次干的，也不管 
它的結果如何，睹博总是継續下去的.这就是說：第二次•賭博迟 
早会发生的，卽对于已知具有 PU / Bj } > 0的•，将“第二 
次賭博在第4次試驗发生”的条件槪率对々加起来应为1 . 所以 
( 2 . 3 )中的第二个級数之和为1，同时我們早 B 知道 XPiAiBf ) = 

+，故 P {£) = —. 这就是我們所要証明的.对其‘它的組合可用 
2 4 

类似的論証. 

注意： 如果賭者可以任意改变賭注的話，情祝就不一样了. 
对于依賴累积贏得的长策，就存在所謂有利策略，而且賭博与策略 
有关.关于这一点，我們将在第十四章第2节里再来討論. 

3. 波雷尔-康特立引理 

有两个关于試驗的无穷序列的引理是經常要用到的，所以应 
該特別加以注意.我們仅仅对伯努利試驗来陈述这两个引理，但 
是，对于普遍的情犹，它們还是可以应用的. 

我們还是考虑一个无穷的伯努利試驗序列.令 本，••- 表 
示事件的无穷序列，其中每一事件只依賴于有限次試驗.換言之， 
我們假定对于每一个小，对应地存在一个使得4是在最初 
的巧次伯努利試:驗的样本空間中的事件.令 

a K = P{^*}. (3.1) 
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(例 如，々 代表“在2々次試驗完了时出現一个最少接連々次成功 
的連貫”的事件，則 W = 2々，而％ = 〆 .） 

对于字母和 F 的某个特定的无穷序列，都可以确定它 M 于 
中的0个或1个或2个……或者无穷多个.这意味着我們可 
以談到£/„它是使事件族 { A k } 中有多于 r 个发生的无穷試驗序 
列.而 C /„ 則表示使事件族{^}中有无穷多个发生的无穷試驗 
序列.事件 W 只能在无穷的样本空間中定义，而它的槪率是 
P { U „ J 的极限，此处 P { C 7„, r } 为次試驗中有多于 f •个4发生 
的槪率.最后， P{CM = l ； mP {[/ r }, 此极限是存在的，因为当， 
增加时， P { U r } 下降. 

弓 I 理 1. 如果收斂，則只有有限个4发生的槪率为 1. 
更精确 地說： 就是要求，当 r 充分大时， P { C 7,} < s . 或者說：对 
每个 s >0可以找到这样一个整数》•，使得对每个〃，《次試驗中 
4+1， ^ r +2, - - •里的一个或多个发生的槪率小于 S . 

鉦.由于級数: Sq 收斂,故我們可以取定一个 r ， 使 <2 r +i + 
〜 +2 + < e . 不失其普遍性，我們可以假設4是如此排列的， 

使得 •••. 令 N 为便 n N ^ n 成立的最后一个下 
标.于是 A 13 ---, A n 都在《次試驗的样本空間中定义了.而引 
理的結論是要 求：在 A r+1 , A r+1 , ■■■, A n 中有一个或多个发生的 
槪率小于 s . 这个結論是成立的，因为从第一章的不等式 (6.6) 我 
們有 

P{^, + i U ^r+aU • ■ * U A n ~) ^ a r +\ + a r + 2 -+■'•• + a N <. e . (3.2) 
至此，引理証毕. 

上述引理,只有在 A 相互独立的条件下，才有一个圓滿的逆 
命題.当試驗串分为一些互不重迭的段落，而只依賴于第々 
个段落中的試驗时，独立性条件就成立了.（例 如：々表示 “第々 
个千次拭驗中产生的成功次数多于600”的事件 .） 

引理 2. 如果 々相 互独立，而且发散，則有无穷个 
发生的槪率为1 . 換言之 ，对 任意一个 r , 在 n 次試驗中多于》•个 
A k 发生的槪率随《 — 00而趋于1 . 
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証.象在引理1中的証明一样，我們令决， • • • ，都 
定义在《次試驗的样本空間中.因为假定了它們相互独立，所以 
卞 們全不发生的槪率是 （1 — « i)(l ■— a 2 ')' • -(1 — a N \ 但当 0 <. X 
< 1 时，1 •— X < e~ x , 因此 （1 — fli ) (l 一 a 2 ) * ， .（1 _ a . v ) < 
^_ ( „ j + as + ... + av )> 因为发散，故随着 at 的增大，趋 
于零.此卽証明了在 （ A ) 中至少有一个发生的槪率为 1. 

其次，我們把 (4) 分成两个子序列和«*)，使两个級 
数 EP ( jn 和 SP (^ r > 都发散.把上面的結論应用到这两个 
子序列上去，我們发现至少有一个及一个 At * 发生的槪率为 
1. 因此中至少有两个发生的槪率为1 . 再把这个事实应用 
到 {/) 和上去，則可以看出 ，（ 木）至少有4个发生的槪率 
为1 . 依此类推，卽可証明我們的引理. 

例. 在一个伯努利試驗序列中，花样 SFS 出現无穷多次的 
槪率为何？令丄表示在第々，々+1，々+2次出現花样 SFS. 

显然不是独立的，但是序列為，為，木0, • ••只包含相互独 
立的事件.（因为其中任意两个事件都不依賴于同一次試驗的結 
果 .） 由于 p 2 q 是不依賴于々的，故級数 a ^+ a ^+ a 7 + ••- 
发散，从而花样 • SFS 无劳次地发生的槪率为 1 . 显然，类似的論 
証可以应用到任何一个花样上去. 

4. 强大数定律 

槪率的直覌槪念基于希望下述事实的 成立： 若 S „ 是伯努利 
試驗序列中前《次試驗的成功次数，則 

^ — (4.1) 

n 

在抽象理論中，这不能对于每一个試驗序列都成立.事实上，在我 
們的样本空間中包含着这样一个 点：它 在无穷的_驗序列中每次 
都出現成功.对它 来說： S „/» = 1，因此 ，（4.1) 就不对了.然而， 
我們可以証明 （4.1) 槪率为1地成立，于是 （4.1) 不成立的情 形是可 
以忽略的例外. 
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注意： 在这里我們所討論的命題要比弱大数定律[第六童 
(4.2)] 強得多.后者只是說，对每个充分大的《来說，平均数 S „/« 
与 P 差不多，但它幷沒說 当”增 加时， S „/» —直停留在的固定 
的邻域內.在《次附加的試驗中，事件 S „ +1 /(7 J + 1) < P — S , 或 
S n + 2 /(» + 2) < p — e , … ，或 S Zn /2n < p — e 中至少有一件发 
生仍是可能的，因为它是很多个小槪率之和，而我們只知道每个个 
別的槪率很小而 B. 但現在我們可以 証明： SJn 一 p 槪率为 1 
变得很小，幷且很小. 

强大数定律 • 对于每^ s > 0,在事件 

p > e (4.2) 

n 


屮，只有有限个发生的槪率为 


这个結論蘊含了 “(4.1) 槪率为 


1地成立在有限的样本空間中，它 断言： 对每一蛆 s >0, 
8 > 0, 有一 个，'，使得对一切下面个不 等式： 

I .~ r+/ c _ 」 〆= a = 1 1 ... >. (4.3) 


-\ , — P \ < S ) ^=1,2, ■ ■ ■ , v , 

I r + 々 I 

同时成立的槪率大于 i 一欠 

証.我們将証明一个更強的命題.令表示事件 

1 

于是由第七章公式 (5.2)， 至少对所有充分大的々 

P{A0 < e~ al °^ = i-. 


从而收斂，因此由前一节的引理】可以 保証： 只有有限 
个 (4.4) 型的不等式成立的槪率为1 . 另一方面，若 (4.2) 成立，則 

>_±_.„去， (4.6) 

(押)蚤 

而当》充分大时，右端大于 C 2 a log «) i . 因此无穷多个 (4.2) 型的 
不等式成立就藏含了无穷多个 A 发生.所以它（无穷多个 (4.2) 
成立）的槪率为零.这就証明了我們的強大数定律， 
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強大敏法則最初为康特立所陈述，其先波雷尔及豪司道夫 
( Hausdorff ) 討論了一些特殊情況.正如弱大数定律一样它只是 
随机变最一般定理中的极为特別的情形.把我們的定理与长策之 
不可能性联系起来，不仅对原来的試驗序列而且对于按照第2节 
中的規則所得到的一切子序列来說，大数定律都蘊含了极限 (4.1) 

的存在性.孕即夸^个 字爭了 寧增尊7睜啡毕 p 葶乎毕9, 

性@都是槪 士們的 ii4 曾 

• ••••••••«•»•«• ••••»•••• • • 

㈣ $ 力•口神輕. 

5. 迭对数法則 

象第七章一样， a 我們再引进”次試驗中正則化的成功次 

数： 

S ? = ~"^ f ， (5.1) 

\npq)^ 

拉普拉斯极限定理 断言： p { s . j 〉 4 〜 1 — $ o ). 因此对 于 》 
的每一个特定的値来說， s 纟取大値的槪率是不大的.但是，直观 
上看来很 淸楚： 在漫长的試驗序列中， Si 或迟或早地会取任意大 
的値 . 纪的中間値是最槪然的，但是它的最大値也在慢步地增长 
tf . 增长的速率如何？在強大数定律的証明过程中，我們曾經断 
言，从 （4.5) 可推出对每一个« > 1和全部充分大的〜不等式 
S * < (2« log ») i 槪率为1地成立.这就給出了 S ? 起伏的上界， 
但是这个上界不好.为了看出这点，訃我們把这个結論应用到 
子序列 S ?， S ?， S 8 *, Sf 6 , . ••上；卽我們定义事件 A 为> 
(2 a log ^) i . 現在因为不等式 (4.5) 蘊含 SA <(2« l 0 g 0 4 对 a>l 
和一切充分大的々.但是，对» = 2 4 ,我們有 log 々 〜 log log n , 
因此我們 断言： 对于每一•个 a > 1和全部形如》= 2* 的》，不 
等式 

S * < (2 alos logn )^ (5.2) 

对某个々以后全成立.所以合适地猜測，应該是 (5.2) 对一切充 
分大的》都成立，事实上，它是迭对数法則的一部分.这个定 
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理 1 〉 断言： （2 log log 是在下述意义下的精确的 上界： 对于每一 
个《>1，不等式 (5.2) 的反不等式对无穷多个”成立. 

定理. 槪率为1地有 

lira sup - ^ - =1. (5.3) 

B '* to (2 log log «) 2 

这意思 是說： 如果 A > L , 則事件 

S„ > + X (^ 2 npq log log n~)i (5.4) 

之中只有有限个发生的槪率是 1; 如果 A < 1,則 (5.4) 对于无穷多 


个》成立的槪率是1 . 

由于对称性，方程 (5.3) 蘊含了 

S ： 


liminf- 


一 L 


(5.3a) 


(2 log log re ) 蚤 
鉦，我們先从以下两个 預备性 的附注人手. 

(1) 存在这样一个常数 c >0,它依賴于 P 而不依賴于《，使 
得对一切的《都有 

P { S n > np } > (5.5) 

事实上，考察二項分布，得知 (5.5) 的左边永不为零，而且由拉普拉 


斯极限定理得知当时它趋于所以它总有大于0之下 

2 

界.这就証明了我們的附注. 

(2) 我們需要下面的引理.令 r 固定，且令3表示以下事件: 


至少有一个 々，& ，使 


S 々一 々穸〉 太. 

(5.6) 

于是 


P {^} < —- P { S „ — np > x} m 

(5.7) 


为了証明引理，令丄表示 “（5.6) 对々= v 时成立而对々=1， 
2, •••， y — 1时不成立”（此处的事件.為，為，•••， 


1 ) 參这个发現中的部分結果曾先由其他的作者得到过.現在的証明是 
为了可以直接推广到一般的随机变量上的情形. 
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是互斥的.同时它們的幷是因此有 

PU} = PW + P{A 2 } + ■■■ + PU,}. (5.8) 

其次对 v <n, 令 R 表示“在第 v+ l,v+ 2, …, n 次試驗中 
成功的总次数超过 O — v ) p ” 的事件.若两个事件 A ， 队都发 
生，則 S „ > S v + {n 一 v^)p > np + X ， 又因为 {■^ V C/ V } 是互斥的， 
所以 


P { S „ — np > x } 

> PU^} + P{A z U l } +--- + P{A n . t U n . 1 } + P{A n U n }. (5.9) 
因为 A 只依賴于最初那 y 次試驗，队只依賴于其后的《 — v 次 
試驗.因此為， R 是相互独立的，从而 P{A V U V }^P{A V }P{U V }. 
从 (5.5) 中我們知道， P{Z7„} >c ，且因 C < 1，故从 （5.8) 和 （5.9) 
可得 

P{S B 一 np ~> x ) ^ c ^ P { A „} = cP {^}, (5.10) 

这就証明了 （5.7). 

(3) 現在我們来証明定理中关于 (5.4) 式中；I > 1的那个部 
分.令/表示这样一个数，使得 

1 < y < 又4， (5.11) 

而且令〜表示最靠近 j r (r = 1, 2, … •） 的整数.令 S, 表示以下 
事件： 至少对一个》， « r < » < « r+1 

S„ — np > A(2w, 抑 log log» r )i (5.12) 

成立.很显然只有当无穷多个艮发生时 （5.4) 才能对无穷多个》 
成立.应用第一个波雷尔-康特立引理，我們看出只需証明 

SP{B r } 收斂 （5.13) 

就够了.由不等式 （5.7) 可知 

P{5,} < t _1 P{S„ r+1 — n r+ ip > A(2»,.p^Iog logn r )s} 

=<r -1 p|sj r+1 >又(2-^— log iog« r )1. (5.14) 

因为 «y» r +i-r -1 >^ 5 所以对充分大的 r, 有 

P{8 r } < «r _1 P{S^ r+1 > (2Alog log« r )i}. (5.15) 

再利用德模佛-泣普拉斯极限定理（第七章公式 (5.2))， 可知，对相 
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当大的『，有 


P { B f } < c ^ e ~^o grfr 


^ (5.10 


…、 c (log^y KHo gr y 

因为 A > 1, 故 （5.13) 的結論得証. 

(4) 最后，我們来証明关于 (5.4) 中的 A <1 的那一部分.这 
时我們选取 r 为很大的整数，使得 


r — 1 
r 


>夕 > 又， 


C =!. L 7) 


其中 7 是在以后要决定的一个常数.令= r, 由于第二个波 
宙尔-康特立引理只能对独立事件才能应用，故我們引进 

D r = S„ r - S „,_ 1； (5.18) 

D r 是从第1次以后剰第次（包括第•次 ■) 試驗中成功的总 
数;对 D , 我們有二項分布 b ( Jc , n , p )， 其中» = «r — « r - l . ^ A r 
为事件 

D r — (« r — n r ^ x )p > ij{lpqn r log log n r )^, (5.1-9) 

往証无穷多个卓槪率为 1 地发生.由于各个不同的次依‘賴干互 
不重迭的試驗段落 ， C 卽 n r _x <»< n r , 亦卽4 K 依賴第 n r -!+\ 
到第〜 次試驗 .） 故 {4} 是相互独立的.因此，根据第二个波雷尔_ 
康特立引理，只須 証明： SP {4} 发散就够了.但 

PUA 

= >J 2 ―^— log log n) h \. (5.20) 

{(/J r — n r ^i)pq}^ n r — n r—\ 

由 （5.17) 可知 n r /( n T — n r _ i ) = r/(r — O < V ' 因此 

P{ > p | P r — — > (2 7 1 or log« r ) 2 1 (5.21) 

{.(«, — n r ^ i ) pq }^ 

再利用第七章 （5.2) 的估計，我們发現对相当大的 r 


PUJ > 


2 J ? log log» r 


2 = 7 ( log log « r )( log n r Y 

(5.22) 


因为 《,= ，，而且 7 < 1, 故对充分大的 r 我們有 PU ,} >丄, 

r 
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这就証明了級数发散. 

証明的最后一步是要驗証 (5.18) 中的 S nr _ L 可以略去.从我 
們已經証明了的定理的第一部分可知，对每一个 e > 0都可以找 
到这样的一个 N , 使得对一切 》• 〉 JV 

i S „ r-1 — n r ^ xp \ < 2 { 2 pqn r - i \ o % log » r _ i )^ (5.23) 

的槪率大于等于 1 一 s . 現在选取7非常接近于1，使得 

i — ,< (宁 )1 ⑽ 

于是从 (5.17) 可得 

4 ra,_i = 4^ < n r ( j ] — A ) 2 , (5.25) 

因此 （5.23) 就蘊含 

S „ r _ 1 — n r -ip > —(9 — A )(2 p ^ w f log log n ,)^, ( 5 . 26 ) 

把 (5.26) 加到 （5.19) 上去，我們得到 (5.4) 对 « r 成立.这就推 
出这个不等式对无穷多个 r 成立的槪率大于等于1 — S , 这就完 
成了我們的証明. 

伯努利試驗的迭对数法則是一个普遍定理的特殊情形，这一 
个普遍的定理是由柯尔莫格洛夫 【 W 1 所首先提 出的. 現在有可能提 
出更強的定理(参看問題 7 及問題 8 ). 

6. 用数論的語言解释 
令*为区間0 < x <1中的一个实数，且令 

x = 0. aia 2 ^ i * * * (6.1) 

是它的+进位小数的展幵式(于是 每个〜 代表数字0, 1，…， 9 屮 
的某一个）.除了《/10” 型的数以外，上面的展开式是唯一的•因 
为 a / lG " 旣可使其展开式表为有限多位(包含无穷多个 ) 又可使 
其展开式包含无穷多个 9 . 为了避免混乱起見，我們决定不用后 
一种形式. 

十进位小数的展开式可以与一个具有? = ^的伯努利試驗 
眹系起来，数字0代表成功，其它的9个数 字代表失敗.如果在 
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(6.0 中以 S 代替 0, 以 F 代替其它的数字， （6.1) 就代表 了具有 

?= — 的伯努利試驗无穷序列的一个可能結果.反过来，任彳可一 
10 

个由5和 F 所組成的序列都可以由某个的十进位小数的展开式 
按上面的方式得之.按照这种方法，伯努利試驗的样本空間中每 
个事件都可以用*的某个集合来表示.例如：“第《次試驗为成 
功”的事件可以用第《位小数为0的那些 AT 来表示.这些*就构 

成了 1() H 个区間，每个区間之长为10—»，它們的总长为丄，这就 

10 

是这一事件的槪率.每一个长为《的有限的样本序列对应于某些 
区間的集合，例如，序列对应于下面9个 区間： 0.01 < 

0.011, 0.02 < a ： < 0.021, ■ ■ 0.09 < *r < 0.091. 每一个这样 
的样本序列的槪率等于其所对应于*軸上之区間集合的总长度. 
更复杂一些的事件常常可以用有限个样本序列的幷来表示，从而 
計算前者的槪率可以按照与^軸上常用的勒貝格 ( Lebesgue ) 測度 
相同的加法規律来进行.因此，我們的槪率永远可以与*軸上对 

应的点集的測度一致.于是我們可以把具有 P -— 的伯努利試 

10 

驗的一切极限定理翻譯成关于十进位小数展开式的定理.术語 
“槪率为1地”等价于“几乎一切或者“几乎处处”. 

我們曾經考 虑过” 次試驗中成功的次数 s n 这一随机变量. 
为了方便起見，在这里我們着重指出下面的 事实： s „ 是样本点的 
函数，我們用3„00代表 r 的前《位小数中0的个数.显然， S „0) 
是 x 的函数，其图形为阶梯多边形，它的不連續点只能在 a /10” 型 
的点上，其中 a 为整数.比値 SXx)/n 称为: C 的前》位小数中零 
的頻率. 

在通常測度論的語言里，弱大数定律所断言 的是： S „0 O/n — 

i 按測度收敛.而強大数定律所断言的是: s„oo/» —丄儿乎 
10 10 

处处收斂.辛欽 ( A . Xhb ™ h ) 的迭对数法則就是說 
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lim sup 


S „( x ) — 


n 

10 


(n log log w)^ 


( 0.3)2 i 


( 6 . 2 ) 


对几乎一切 x 成立. 它回答 了一系列論文中所硏究过的一个 
問題.这个結果的更进一步的改善，請参看問題7及問題8 . 

代替数字0，我們可以考虑用其它的数字.那么強大数定律 
可以解 释为： 对几乎一切: c ， 这（0, 1，…， 9) 十个数字中每一数 


字的頻率都趋于如果把+进位系統的基“10”換为其它的基， 

10 

就可得出类似的定理.这个事实曾为波雷尔 （1909) 所发現，且往 
往表 述为： 几乎一切的数都是“正常的”. 


7.問 題 

1.求一个整数化使得在擲骰子时“連績出現三次么点的連貫”先于“长 
为 P 的非么点的連貫”的出現，而出現的槪率大約为 4. 

2 .考虑具有三个可能結果 <4, B，C 的相：！：独立的重复試驗， C 所 
对应的槪率分別为 r (P + ? + r = 1). 求“接連出現 at 个 d 的連貫” 
在“接連出現0个£的連貫”之前的槪率. 

3 (續上題）.求长为 a 的連貫发生在一个长为戶的 B- 連貫或在一 
个长为 r 的 o 連貫之前的槪率. 

4 •在 伯努利試驗序列中 ，令禹 表示在第 2" 攻到第2»+ 1 次試驗中接連 
出現”次成功的事件.如果,則有无穷多个4发生的槪率为1;如果 

p < f ， 則只有有限个4发生的槪率为 1. 

5 1〕 .令 N„ 为在第《次試驗开始的成功連貫的长度 （ 卽是，如果第《次試 
驗的結果是= 等等）.証明 

lim sup ―—— =1 (7.1) 

Log n 

的槪率为1,其中 Log 表示以 lyV 为底'的对数. 

提示： 考虑一个长度超过《 Log 的成功連貫在第《次試驗之后的事件 


1) 从奈依曼 (D. J. Newman) 的一篇稿件中提由的. 
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对 a > 1 ，計算是非常順利的，对<丨，考虑試驗次数的一个千字列 
■••，其中是与 》 Log «非常接近的整数. 

6.从迭对数法則我們可以 推出： 有无穷多个》使 ~( n <^< l 7«) 全是 
正的槪率为 1. (注 意： 应用第 三章的結果， 可以証明更强的結論 .） 

7 .令中 (?） 为芷的单調上升函数，且令〜为最接近的整数，如果 

-\ f 2 { n r ) 


K \ 


<K»r) 


(7.2) 


收斂，則槪率为1地只有有限个《使 

S„>np 4- { npq )^ p { n ) (7.3) 

成立.[注 意： 不妨假設 《 K »)< io ( i 0 gios ») i , 因为对于更 大的* K ”), 迭对 
数法則足够对付这个問題,] 

8.証明級数 (7.1) 收斂当且仅当 


二 <>(») e -蚤沪 2 (») 


(7.4) 


收斂.[提 示： 归幷对 应于〜 -!< » < 々的 那些項，幷注意》<•— 
1/ 1 叫0;此外（7.3)只有当中 2 («)>2 log log » 时才能收敛 .] 


1) 問題 7閗題8 合在 一起証 明了： 在不等式 (7. 4)凇斂的淸形下，概率为1地只 
有有 限个” 使不等式 (7.3) 成立.反过来，如果 (7.4) 发散，則概率为1地有无穷 
多个》使不等式 (7.3) 成立.其逆是很难証明的，参看 [64]， 其中对于任意随机 

变: t 的更一般的定理都証明了.对干具有 P = y 的伯努利試驗的特殊情形, 

請参閱 [65], 迭对数法 則是从 ^>(0 =： A (2 log log 0 的特別情形得出的. 
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第九章随机 变量; 期望値 

1.随机变量 

按照微积分教科书上的定义，如果对每一个实数 X 都有唯一 
的一个値 y 与之对应，則称 y 为实变量^的函数.这个定义可以 
推广到自变量 * 不是实数的情形.我們可以称两点間之距离是一 
对点的 函数; 三角形之周长为定义在三角形集合上的 函数; 序列〜 

是定义在所有正整数上的 函数; 二項式系数为数对(*，0 ( 其 

中第二个数々为非負整数)的函数.同样，我們可以称《次伯努利 
試驗的成功次数5„为样本空間上的 函数； 这个空間由 2 "个样本 
点組成，且每一个点都对应于一个数 s „. 

定义在样本空間上的面数就称为随机变量.在前面各章里面 
我們一直用着随机变量的槪念，只是沒用这个术語罢了.举几个 
典型 例子： 打桥牌时手中爱司的个数是随机 变量； ”个人中生日 
相同的人数是随机变量；《次伯努利試驗中成功的連貫数是随机 
变量.在每一种情形都有唯一的一个規則使每一个样本点与一个 
数 X 联系起来.槪率的古典理論主要是致力千賭徒的贏得的硏 
究.而賭徒所获之贏得是一个随机变量.事实上，每一个随机变 
量都可以解释为一个貭实的或者假想的賭徒在适当賭博中所获之 
贏得.在物坪系統中扩散时貭点的位置、能量、温度等等都是随机 
变量，但是它們是定义在非离散的样本空間中，因而，对于卞們的 
硏究将放在以后.在离散的样本空間的情況下，我們眞正可以把 
任一随机变量 X 列表表示，卽用某种次序把样本空間中的所有的 
点列出而且与每一个点相对应的 X 的値也都列出来. 

随机变量这一术語有些模糊，而說随机函数則更合适一些 
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[其自变量为样本空間中的点，亦卽一次实驗的結果]. 

令 X 为随机变量，々，々，々， . ••为 X 所取之値”（在下面大 
多数情形中，巧将为整数）.所有的那些样本点，使得在其上 x 取 
固定値: tv 者构成事件 ：X = 它的槪率以 P{X =巧}表示.下 
列 函数： 

P{X = Xj} = f ( xj ) (/ = 1, 2 , • • •) (1.1) 

叫作随机变量 X 的(槪率)分布 1 2) . 显然 

/(^ j ) ^ 0 5 = 1. ( i -2) 

如果应用这些术語，我們可以說伯努利試驗中的成功次数 s n 
是一个具有槪率分布 { bik -, n , p )} 的随机变量，而一直到第一次 
成功出現（包含这次試驗）所需之試驗次数是一个具有槪率分布 
{ 〆 ■>}的随机变量. 

現在我們考虑定义在同一个样本空間中的两个随机变量 X 和 
Y , 其所取之値分別記作巧，幻， . ••和外， y 2 , • • • ;且其对应的槪 
率分布为{/(々）}和 { Kw )}. 同时滿足 X =巧和 Y = n 这两 
个条件的点的总体构成一个事件，其槪率記作 P { X =^； Y = n }. 
下列 函数： 

P{X = Xj , Y = y t } = p { xj , yO (. 7 , k = 1，2, . •，）（1.3) 
叫作 X ， Y 之联合槪率分布.最好是用如表1， 2 所例示的双重記 
录表来表示它.（注 意： 行数与列数不一定要求相等)显見 

vk ) ^ o , >■: ?( 〆 /， y 々） = 1， （1-4) 

i,K 

且对每一个固定的】有 

1) 在标准的数学术語里，点集約 ，… 称为 X 的 値域. 不幸的是，統計的文献 
里，把 X 的最大値和最小値之差称为値城. 

2) 对一个离散的随机变量 X 来誼，其槪率分布为定义在 X 所能够取的値巧的总 
体上的函数/(巧），这个术語必須要与 “分布 函数”这一术語区別开来.分布函 
数是一个非降的函数，且当* ■♦一00时它趋于0 ;当1-»00时，它趋于1 . X 之 
分布函数 Fix ') 用下式来 定义： 

FO) = P{X<ar} = f( x 0 » 

最后的和是跑 遍一切 不超过 T 的巧 •. 故4随机变量的分布函数可以从其概率 
分布計算而得，反过来說也对.在这一卷里我們不討論一般的分布函数. 
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p (, Xj , y x ) + p ( x h y 2 ) + p ( x ；, %) + ••• 

= P{X = ar；} = (1.5) 

表 1. 例 ( a ) 中 （ N , XQ 的联合分布 


1 

0 

X. 

1 

2 

3 

N 的分布 

l. _ 

1 

2 分 

0 

0 


1 

Zq - 

= 丄 

N 2 


6 守 


0 

18^ = 

2 

=_ 

3 

3 

0 

6 孕 

0 

0 

6q = 

= 三 

X! 的分布 

% 

12 彳 


q 

i 


E ( N ) ~ E ( N a ) = Vat ( N ) = 

E(XO = 1 ， E(X?)= 吾， VarCXa) == j-, 

E(N,Xi) = Cov(N,X!) = 0. 


N 是 3 个球随机地放入三个盒中铍装进球的盒的个数， Xi 是第 
一个 盒:中的球的个数.簡記分 = 4-. 


表 2. 例 （ a ) 中（&,夂2)的联合分布 


1 

0 

Xa 

1 

2 

i 

3 1 

1 

Xi 的分布 

0 

夺 

3 孕 

M 

<i 


1 

3 穿 

6 孕 


0 

Mq 

x a 2 


3 彳 

0 

0 

6 分 

3 


0 

0 

0 

q 

x a 的分 •布 

Sq 

12^ 





E(X,-) = 1 ， E(X ，） = 菩， Var(X;) = — , 


E(X 1 ,X a ) = A, Co V (X u X a ) = 

X, •是 3 个球随机地放入三个盒; 中第； 个盒;中的球的个数.簡記 1 = ^. 
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对每一个固定的々有 

〆 々， y 々 ） + p(x 2 , yk) + p{x 3 ,y^) + ••• 

= P{Y = y ^} = g { y k ). (1-6) 

換言之，把每行或每列的槪率加起来，我們分別得到 X 或 Y 的槪 
率分布.这两个分布叫作边緣分布;它們可以在表上显示出来，象 
表1,2中那样.“边緣”这一形容詞是从双重記录表的外貌想出 
来的.而且当上下文中两个随机变量的联合分布及它們的单个 
(边綠)分布同时出現时，为了文体上的淸晰，也应用“边綠”这一形 
容詞以示区別.严格 地說： “边綠”这一形容詞总是多余的. 

联合分布这一槪念完全可以移植到多于两个随机变量的系統 
上去. 

例. （ a ) 把3个球随机地故入3个盒內.我們考虑一个形 

• •»••••• • • • 

式上由表1及第一章例 (2. a ) 所定义的27个点构成的样本空間， 
对每一个点我們賦以槪率1/27.令 N 为 B 放有球的盒的数目，令 
X , 为第 i 个盒中的球的个数， /■ = 1, 2,3. 这些都是形象性的描 
述.形式上看 N 这个函数在第 1-3 个样本点上取値1;在第 4-21 
个样本点上取値为2;在第 22-27 个样本点上取値为 3. 因此 .N 

的槪率分布为 P { N = l }= 丄， P{N = 2} = — , P{N ,-5} = 

9 3 

~ ( N , X 0 和 ( X i5 X 2 ) 的联合分布由表1和表2給出. 

( b ) 哗于.把一个均勻的骰子擲《次，令沁， X 2 , X 3 分別为 
么点，二点，三点出現的次数.擲 ”次的 秸果么点出現幻次；二点 
出現 心次； 三点出現心次，而其它各点出現 n — h - hU 
的槪率 p ( M ， h , 心）由第六章多項分布 0.2) 所給出，其中灼= 

~ pi ^ ^ 也 

6 2 


pd 々2，々3) = 


. _ n\ _ 

々 l !々2!々3!( n — 々1—々2 — 々3)! 


3 ft 一纹吻—幻 6—”• (1.7) 


这就是 X l5 X 2 , X 3 的联合分布 . tt 心 ，知 固定，把 （1.7) 对一切可 
能的心= U ， L， … h — 心求和 ，再应用二項定理我們得到 
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K 々 l ，々2) 


n \ 


4 移一 弋 1 一先 a 6 _ 


( 1 . 8 ) 


(: » — 々 1 一 々 2 ) ! 

这就是 （ Xi ， X 2 ) 的联合分布，但是，它又是 Xh x 2 , x 3 的三維分 
布的边綠分布.无需說， （1.8) 可以由多項分布直接得出.把 （1.8) 
再一次对全部的心= 0, 1， •••，《 — 匕求和，我們得到 Xi 的分 


布，卽是具有 p = i 的二項分布. 

6 

(c) mm. 把一个具有"个元素的总体分为三类 •其大 小分 
別为 A = npx, n 2 =^ np 2 , n 3 = np 3 (其中 pi + p 2 + ^ = 1) •設 
从总体中柚取一个大小为 r 的随机样本，幷令 X；^ X 2 分別为这个 
样本中第一类和第二类中的元素的个数.如果柚样是有放回的， 
則 P{Xi = X2 ~ ^2} 由多項■分布 


/(々 I ，々2) 


r ； 


Pl L p 2 J pr 


•先 1 一 Al2 


(1.9) 


々 i !々2!<>— 々广心）！ 

所給出[参看第六章公式 (9.2)]. 随机变量X:具有二項分布〆々； 
«, p；), 如果抽样是无放回的，則 P{X x = ki, X 2 = ^ 2 }由第二章 
(6_幻所給出，而\則具有第二章 (6.1) 的超几何分布. 

(d) 随机抽样.我們再来考虑前一个例子，只不过現在样本 

• • • • 

的大小 r 不是事先給定的，而是依賴于一个随机試驗的結果.更 
确切地說，假定样本的大小服从普阿松 分布： 样本的大小为 r 的 
槪率为 p ( r ; A) = e ~^/ r \, 而在样本的大小，給定后，\ =心 


和 X 2 =々 2 的（条件）槪率由 （1.9) 的 /( H ) 所給出.因此， 
(X,, X 2 ) 的联合分布为 


P{Xi = 4 i 3 X 2 -= kj) = e~ k 2 A7( 々 i, 々 2)/>! 

r —々 i +々 a 


或 


= e ~k . (义外乃气义户 2 ) 之 2 ( 又 内户 ” 

々 i !々2! k =0 々 3 ! 

— e — A(l—pj) a Pl )^ap 2 )^ 
kilk.il 

P{X! = ^,x 2 = k^) = pUpiUApA . 


( 1 . 10 ) 

( 1 . 11 ) 
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对所有的 Zb 求和，我們看到 Xi 具有普阿松分 布 〆 々； A Pl ). (第六 
章問題 2 7說明同一个事实 .）( Xi , X 2 ) 的联合分布取边綠分布 
{ p (4； 2朽）}和{ 〆 々； Ap 2 )} 的乘法表的形式.这时我們就說 Xi * 
x 2 独立. 

应用（ I . 3 )的符号，則在 X = A 給定的条件下 （ f (巧）> 0)， 
事件 Y = y k 发生的条件槪率变为 

P{Y = y k [X = Xl } = (1.12) 

Kxj) 


为了方便起見，把 （1.12) 簡写为 P{Y = y*|X}; 这就定义了給定 
X 后， Y 的(条件)分布.从表1和表2中一看便知：一般地說， 
条件槪率 （1.1 2 ) 与 g { yO 是不同的.这表明从 X 的値我們可以对 
Y 的値作一些推測，反过来說 也对； 这两个随机变量是（統計地）不 
独立的.当 Y 是 X 的面数，也就是当 X 的値唯一决定 Y 时， X 
与 Y 之間存在着最強度的依賴性.例如把一个錢 币扔〃 次，令 X 
和 Y 分別为“正面 ”及“ 反面”所出現的次数，則 Y = » — X. 同 
样，当 Y = X 2 时，我們可以由 X 来計算 Y. 这就意味着，在联合 
分布 中每一 行除了一項以外其他的都是 o . 另一方面，如果对一 
切組合： cy ， yt 都有 p { xj , y t ) = Kx ^ gCy ^, 則事件 X = 与 
V = 抑是相互独 立的; 且联合分布取乘法表的形式.这时我們称 
随机变量 X ， Y 是相互独立的.特別地联系于独立的試驗就会出 
現相 互独立的随机变量. 例如： 把一 顆骰子擲两次其所得之点数 
是相互独立的随机变量.不同性貭的一个例子可見例 （ d ). 

注意： X 和 Y 的联合分布决定 X ， Y 的分布.但是从 X， Y 
的边緣分布不能算出 X 和 Y 的联合分布.如果两个随机变量 
X ， Y 有相同的分布，則它們可能相互独立也可能不相互独立.例 
如在表2中的两个随机变量 X l5 X 2 不是相互独立的然而却具有 
相同的分布. 

所有这些槪念都可以应用到多于两个随机变量的情形.我們 
扼要地重述为如下的形式 定又： 

定义. 所謂一个随机变量 X ,卽是定义在一•个給定的样本空 
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間上的函数，也就是对每一个样本点給予一个实数与其对应.方 
程組 （ l . i ) 定义 X 的（槪率)分布.如果两个随机变量 X 和 Y 定义 
在同一个样本空間中，則其联合分布由 （1.3) 所給出，节給出了 X 
和 Y 取一切組合（々_, 的槪率.这个槪念可以推广到定义在 
同一个样本空間中的任意有限个随机变量 X , Y ,- -, W 的情形. 
如果对任意一組値 ( x ， y ， …，都有 

P{X = x , Y = y , • ■ • , W = tu } = 

= P{X = *} P{Y = y }--- P { W = «-}, (1.13) 

則說随机变量 X , Y , •, W 是相互独立的. 

在第五章第 4 节中我們曾經定 义了” 次相互独立試驗的样本 
空間.把这个定义与 （1.13) 比較，我們看到，如果 Xt 只依賴于第 
々次試驗的結果，則随机变量 x l7 •…， x „ 是相互独立的.更一 
般地，如果随机变量1/只依賴于前々次試驗的結果，而另一随机变 
量 P 只依賴于后面 n - k 次試驗的結果，則£/， F 是相互独立的 
(参看問題 39). 

我們可以把随机变量想象为样本空間中的点子的一种标記. 
这种手續在殺子的例子中是很熟悉的，在骰子上每一面都用数目 
来标明，而且我們把数目說成是单独試驗的可能的結果.在传統 
的数学术語里，我們說随机变量是由原始样本空間到新空間上的 
映象，这个新空間的点子是 Xx , x 2 , •• •，因此有： 

当{/(巧）}滿足条件 （1.2) 时，不再涉及原来的样本空間，我們 
就可以說一个随机变量 X 以槪率 f ( x 2 ), •■- 来取値〜 
•••; 新的样本空間是由样本点 巧， 巧，…构成的.指定一个槪率 
分布等价于指定一个点为实数的样本空間.談及两个相互独立的 
随机变量 X ， Y 具有分布{/(々）}，等价于談及一个以数对 
为样本点的样本空間，且其槪率由 P { U +， n )}= fU ') Kw ) 
来 确定. 同样，对一袓》个随机变量( X , Y , ■…， W ) 所对应的样 
本空間，我們可 以取” 維空間中的点 ( x , y , •…， 所构成的点 
集，而其中的槪率由联合分布所給出.如果联合分布由 （1.13) 所 
給出，則說随机变量是相互独立的. 
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例. fe ) 具有可变槪率的伯努利試驗.考虑《次相互独立 
的試驗，知-次試驗都只有两个 結果： S 和 f . 第々次試驗出現 S 
的槪率为内，出現 F 的槪率为^ = 1 - p k . 如果以=則这 
个方案就变为伯努利試驗.最簡单的描述它的方法是把5和 F 分 
別賦以傾:1和 0. 因此，这个模型完全可以用下面的語言来 描述： 
我們有《个相互独立的随机变量序列 X *, 的分布为 P { X * = 
1} = 朽， P { X k = 0} == q K . 这个方案可以了解为“普阿松試驗” 
[参看例 (5. b ) 和第1~一章 (6. b )]. 

显見，间一个分布可以联系不同的样本空間.如果我們說随 
机变量 X 各以1/2的槪率取値1和0,則我們就默孰了一个由0,1 
两点所构成的样本空間.然而，我們也可以用这样的約定来定又 
随机变量 X: 把一个錢币扔十次 ，若第 +次出現正面，則 X 取0 •，出 
現反面，則取 1. 这时 X 就定义在由所有的序列所构 
成的样本空間上，迖个样本空間有 2 W 个样本点. 

原則上，我們能够把槪率論限制在由随机变量的槪率分布槪 
念所确定的样本空間上.这样作就避免涉及抽象的样本空間，也 
避免涉及到“試驗”，“实驗的結果”等术語.把槪率論化为随机变量 
的理論立刻导致分析知識可以用上而且在各方面簡化了理論.然 
而，它也有美中不足之处，那就是使得槪率背景晦涩不明.随机 
变量的槪念仍然容易含糊地当作“某些以不同的槪率取不同的値 
的东西”，但是随机变量本身是通常的函数，而函数这个槪念幷不 
逄槪率論所特有的. 

例. （ i ) 令 X 为一个随机变量，其可能取的 値为 ; m &，•••， 
且对应的槪率为 f { Xl ) , fCx 2 ) , ■■■. 为了帮助讀者想象，可以构 
造一个槪念性的实驗来导出 X . 例如把輪盘賭具的輪盘分成弧 
1, 12, •••. 其长度为/(々）：/(々）•••••.如果輪盘賭在弧 A 中的 
某一点停下来，則我們可假想某一个赌徒获得一笔款項 A (正的或 
者負的）.于是 X 就是那个赌徒所获的利益.在《次試驗中所获 
之利益假定为》个具有共同分布 {/ O ,)} 的相互独立的随机变量. 
如 訃每一 个粗合 (>/, 穴）都有一段弧与之对应，且这时想象两个賭 
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徒各获利巧，便得到具有給定的联合分布 { p (^， n )} 的两个随 
机变量. 

若 X , Y , Z ， …为定义在同一个样本空間上的随机变量， 
則任一函数 f ( X , Y , Z ，_.*) 仍然是一个随机变量.其分布可以 
从 X ， Y ， Z ， …的联合分布得出，卽簡单地把 F(X, Y ， Z ， …） 
这些取同一値时的所有的組合( X ， Y ， Z , • • •) 的槪率加起来. 

例. （ g ) 在表2所表明的例子中，和 X x + X 2 是一个随机变 
量，其可能取的値为0, 1，2, 3,且其对应的槪率为 t 6 g ， U 9 , Sg 

其中《 = JL ). 积足 x 2 是另一随机变量，其可能取的値是 

0, 1，2,其相应的槪率为 15 q ，6 q ，6 q . 

2 .期 望値 

为了得到合理的簡化，常常需要用一些“特征値”来槪要地描 
述槪率分布.在以前的关于等待时間的問題中曾經涉及过的中位 
数就是一个例子.分布 （1.1) 的中位数“滿足 条件： P{X < 

<丄和 P{X ><丄的数値〜.換句話說，中位数〜,是这 

2 2 

样一个数，它使得 X 起过它或者少于屯的槪率都接近 1/2. 

然而，在这些特征値中，期望値或者均値是非常重要的一个. 
一則对于卞易于作分析处理，二則卞有一个好的性貭，卽柚样的稳 
定性而使得統計学家們喜欢用它.它的定义来自习•慣上的平均槪 
念.假定在由家庭所构成的总体中，有々个小孩的家庭有巧个， 
于是家庭的总数为 ra = » 0 + »1 + »2 + • ' • ,而小孩的总数为 
w = »i + 2 n z + 3 ns + • • •. 故每个家庭的小孩平均値为 m / w . 槪 
率与頻率之間的类似性启发我們給出下面的 定义： 

定义. 令 X 为一个随机变量，其可能収的値为； &，•--， 
且其对应的槪率为 Kxt ), /(&)，• _ •，若下列級数 

E ( X ) = 尤々） (.2.1) 

絕对收斂，則定义 (2.1) 右边的級数为 X 的期望値或者均値.这时 
我們說 X 有有限的期望値.如果 SlqfKu ) 发散，則說 X 沒有 
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有限的期望値. 

不用說，最常用的随^^变量都是有有限的期望値的；否則这个 
槪念就沒有实际意义了.然而与物理学中一些重要的复現問題相 
联系的随机变量就沒有有限的期望値.“均値”、“平均数”、“数学 
期 望”、 “期望値”这些术語都是同义詞.我們有时也說分布的均値 
来代替随机变量的均値.在数学和統計学中 ，一 般采用 E ( X ) 这 
一符号来表示 X 之期望値，而在物理学中則通常用 X ，〈 X >，< X > A „ 
来代替符号 E ( X ). 

我們希望計算例如說 X 2 的期望値 .. 这个函数是一个新的随 
机变量，其所取的可能值为—般地說 X ? = x \ 的槪率不是 
KxO 而是 /(^) + K - xj . 而且定义 E ( x 2 ) 为 + 

/( — 々）}，求和上一撇表示只对.时求和.显見 

E(X 2 ) - 24 ， ( 外)， （ 2.2) 

如果右边的級数收斂的話. 

更一般地，我們用同样的方法可 得出： 

定理 任一函数令 O )， 定义一个新的随机变量令 (X) .如 
柒 0( X ) 具有有限期望値，則 

E (令( X )) = (2.3) 

此处的級数絕对收斂当且仅当 E (中 ( X ))存在.对任一常数 a ，我 
們有 E { aX ) = « E ( X ). 

如果几个随机变量 X 1 , ,X„ 定义在同一个样本空間上， 

則它們的和 X! + • • • + X„ 是一个新的随机变量.它的可能値 
与对应的槪率可以从 X„ 的联合分布找出，从而 E(Xi+ - - - +X„) 
可以算出.下面的重要定理提供了一个簡便的計算方法： 

定理 2. 如果 X l5 X 2 , • • , X B 都是具有有限期望値的随机 
变量，則它們的和的期望値存在，且其和的期望値就等于期望値的 
和： 

E (^ + …+ X „) = ECXO + • • • + E ( X „). (2.4) 

証.只需对两个随机变量 X ， Y 的情形来証明 （2.4) 就够了. 
应用 （1.3) 的符号，我們能够写出 
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E(X) + E(Y) = 2>,〆 xj, yid + yhP^ x i-> 外)， (2.5) 

i,k i,k 

这个求和法跑遍一切可能的値 A , 只（它們不需要完全不同）.由 
于 （2.5) 中之两級数絕对收斂，故其和可重排次序，从而得出 
D U + n )? U ， W ). 由期望値的定义得知，这就是 x + Y 

i.K 

之期望値.于是，我們完成了定理的証明. 

显然，对于随机变量的积，是沒有与上述定理对应的一般定 

理.例如 E(X 2 ) —般地幷不等于 E(X) 2 . 如 X 是攤一顆均勻的 

骰子所得的点数，則 E(X) =丄，但 E(X 2 ) = (1 + 4 + 9 + 16 

2 

+ 25 + 36)/6 = 91/6. 然而，对相互独立的随机变量来說，簡单 
的乘法規則是成立的，这就是下面的 定理： 

定理 3. 如果 X ， Y 是具有有限期望的相互独立的随机变量， 
則它們的积也是具有有限期望値的随机变量，且 

E(XY) = E(X)E(Y). (2.6) 

証.为了計算 E(XY), 我們将对每一个可能値巧八乘上其 
对应的槪率.前面 E 經指出，在定义〔2.1)中4之値不一定完全不 


同.因此 

E(XY) =工) x/y^fCx^giyO = 

= {2j n^(n)}. ( 2 - 7 /> 

上面关于級数重排次序是可以允許的，因为这些級数为絕对收斂. 
这就証明了我們的定理.由归納法可 推出： 对任意有限个相互独 
立的随机变量，类似的乘法規則还是成立的. 

为了方便起見，我們給出条件槪率分布的数学期望的槪念. 
如果 X 和 Y 是服从联合分布 （1.3) 的两个随机变量，給定 X 后 Y 
的条件期望 E(Y|X) 由 下式： 


y^p(- x f yO 

_i _ 

K K ^ i ) 

定义，如果級数絕对收斂，而且对一切 7_ 有 / O ,') > o . 


2 y.P{Y = y,|X = ^} 


( 2 , 8 ) 
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3. 例子及应用 

( a ) 令 S „ 是在”次成功槪率为 P 的伯努利試.驗 

中的成功•我們知道 s „ 具有二項分布{ 〆 々；《， ？)}. 因此 
E(S„) = 《， ？） == npK\ — 1 ; « — 1 . p ) ,而最后一个 

級数包含了对应于《 — 1的二項分布的一切項，故其和为1.因 
此二項分布的均値为 

E(S„) = np , (3.1) 

不需要直接計算而采用一神常用的方便方法仍可得出同样的 
結果.令 X & 为第々次試驗中成功的次数，則这个随机变量只取値 
0,1，且其对应的槪率为 H 因此 E(X t ) = 0 • (JT + 1 • p = P . 
又因 

S„ = X t + X 2 + • • • + X fl . (3.2) 

故从 （2.4) 便可直接得出 （3.1). 

( b ) 哮兮苹 . 如果 X 具有普阿松分布 K 々 ; A )= e _ UV 々！ 
(其中々= 0, 1，2, …） .則 E ( X ) = 2々 p (々; A ) = ASp (々一 1;义）， 
而最后一个級数包含了普阿松分布的一切項，故其和为 1. 因此 
普阿松分布之均値为久. 

( c ) 負二項分布.合 X 为具有几何分布 P{X =々 }=《V 

春參 ••鲁 

(々= 0，1, 2，…）的随机变量.于是 E(X) = 5 p(l + 2^+3^ + 
•••；. 右边是一个几何級数的导数，所以 e ( X ) = q P {. i - ^ r 2 = 
q/p. 在第六章第 8 节我們曾經看到 X 可以解释为一个伯努利試 
驗序列中第一次成功以前失敗的次数.更一般地，我們硏究过对 
应于直到第《次成功出現为止的伯努利試驗的样本空間.当》"<« 
时，令 Xi = X,^X r 为从第 r 一 1次成功之后到第 r 成功之前 
的失敗次数.于是每一个 X, 都具有几何分布{彳>}，而且 E(X„) 
.和 Y, - X! + • • • + X r 是第，次成功以前失敗的次数. 
換句話說， Y , 是一个随机变量，它的分布是如第六章 （8.1) 或等价 
的 （8.2) 所定义的負二項分布. ri 3 此推出，这个負二項分布的均値 
为 rq / p . 这也可以用直接的計算来驗証.显然，从第六章 （8.2) 推 
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出々/(々； r ， p ) = rp ~ l qf { l { — l ; » + 1, p )， 而这个分布的諸項之 
和为 1. 这个直接的計算有一个 好处： 它也可以应用到非整数， 
上去.另〜方面，第一种推导不需要知道 Xj + ■•- 4- X r 的分布 
的显明形式就可以得出結果. 

( d ) 抽样的等待时間.从具有《个不同元素的总体中，作有 

• •••••• 

放回的柚样.由于重迭性，大小为的随机样本中所包含的不同 
的元数一般地小于 r 个.当样本的大小增加时，新元素进入样本 
就会愈来愈小.在这个試驗中有一个很有趣的随机变量，那就是 
得到 r 个不同元素时的样本大小 S r . (例如，考虑况= 365个可 
能的生日，这里民就 表示： 当样本中包含了 r 个不同生日的人 
时，所柚出来的人的数目.类似的解释可以用到球放人盒中的例 
子.贈券或其他玩物的收集者对我們的問題特別威兴趣，如果他 
得贈券的情況可以比作随机抽样的話 1 

第一个元素在第一次抽取时进人样本，从第二次抽取一直到 
另--新元素进入样本时所抽取的次数是一个随机变量又，一般地 
令？ c 为从第个不同元素进入样本后到第 》• + 1个不同的元素 
进入样本所需之抽取次数.于是 S , = 1 + X , + • _ . + Xh 是 
第 r 个新元素进入样本时的样本大小.当样本包含了々个不同的 
元素时，每次柚取中获得新元素的槪率为 P =-( N - 10/ N ^ 到达 
而且包含抽出一个新元素的次数等于槪率为 P = (/V — 々 )/N 
的伯努利試驗第一次成功前的失敗次数加上 1. 因此， E(XO == 

1 +互= AV(N -々），而且从加法定理 （2.4) 得出 
P 

E ( S f ) ― N H ---+ --- h " • + --- } • 

(3.3) 

= N ， 我^[門得到把总体所有的元素都抽到的期望値.如 
A / = 10，則 E ( S 10 ； = 29.29 E ( S 5 ) = 6.46 ….迖就意味着， 


0 参看 [66]. 波利亚用不同的方法处理了一个稍为更一般的問題.討論贈券凇 
集問題的文献是很多的. 
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我們可以期望大約以 6 次到7次的柚取把总体中的一半元素抽出 
来，而剩下那一半則需要23次以上柚取才能抽出来.对相当大的 
ZV ，（3.3) 有一 ■个 良好的逼近： 

E(S r ) «= ZVlog --- . (3.4) 

N — r + I 

特別，对任一分数 ct < l ， 当 iV 充分大时，要求样本中包含的不同元 
素为总体的《份时所需之抽取次数的期望値近似地为 W log 1; 

1 — a 

要求样本中包含全部 A 7 个元素所需的抽取次数的期望値近似地为 
2 VlogN . 注意，在这里我們又沒有用分布就得出了上述的結果. 

( e ) 丁个哮 ，喂 寧. 一个碗中装有 W 个标有号数1到 N 的 
球.令乂^^^用^^^回的随机抽样时，”次柚取中所抽出来的最 
大的号数.事件 X < 々意味着所抽出来的《.个号数中每一个都 

小于等于々，因此 P{X {^)\所以 X 的槪率分布由 

pk = P{X = 々 } = P{X < 々 } 一 P{X < 々 ~ 1} = 

= U” 一 u — 1)"}AT" (3.5) 

所給出.故有 

E(X) = Kpk = N~ n — （ 々一 i)” +1 — (々一 l)*} = 

1 々 =1 

= N~ a I N a+1 - 2 ( 々 - i)*}. (3.6) 

对于相当大的 2V, 最后一个和近似地为四条曲綫 y = .V”，^ = o, 
x = 2V y = 0所围成之面积.也就是說，它等于 N a+l /(n + 1). 
由此推出，对于相当大的 W， 有 

E(X) 〜 AT . (3.7) 

W + 1 

如果一个城市有 W = 1000辆汽車.塊察一个» = 10的样本， 
由 （3.7) 知其执照牌上的最大的号碼（假定随机性）的期望数大約 
是910 (中位数为 934). 应用統計学家利用由样本中所覌察到的 
最大値来估計未知的眞实数目况.在第二次大战期間，曾用此法 
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估計敌人的生产[参看間題 8—11], 

(0 巴拿赫火柴盒問題.在第六章第8节中我們求出，分布 





2 2N ~ r 


(3.8) 


是第一衣发現空盒时而另一个盒中所剩下的火柴的根数 X 的分 
布.我們不能用直接的方法去計算期望値 E(X) = ft , 但是下面 
的間接的办法在很多情況下都是可以应用的.利 用七 之和为1 
(这是不容易驗証的）这一事实，我們求得 

iV — 户=— r)» r =文0 — ，）( 2 : _ r )- 2 ^_ r . (3.9) 

f = o r =：o \ N — r/2 A r 


对二項式系数加以簡单运算，得知最后的和变为 




r 2 N — r — L 

v M 一 T — 1 


n ： V- r 


= 2 上^ + (3.10) 

最后的和与定义 ft = E(X) 的和是一样的.第一个和包括除岣 
以外一切其它的《,，因此第一个和为1 一故由 （3.9) 与 (3.10) 
得出 


A ,_^? iV 4 LL(l _ Wo) _^ 
2 2 


或 


( 2N + l)w 0 — 1 


27 V + 1 12 N 、 


2 2 N 


N 


应用史特令 公式，我 們发現 






\7 C / 


(3.11) 

(3.12) 


(3.13) 


特刖，在第六章表8的分布中 ， N = 50 这时 jii = 7.04-• •，而中 
位数为 6. 


4.方差 

令 X 为一个具有分布彳/(巧）}的随机变量，且令 ；• >0为一 
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个整数.如果随机变量的期望値存在，卽 

E(X，）= MU) (4.0 

存在的話，則称它为 X 的 r 阶矩.如果級数 (4.1) 幷不絕对收斂. 
則說 X 的 r 阶矩不存在.因为 IX 卜 |Xp + 1，故 r 阶矩存 
在时，^ — 1阶矩也存在，从而前面的各阶矩都存在. 

在一般理論中，矩有重要的意义，然而在現在这一卷书里，我 
們仅仅用到二阶矩.如果二阶矩存在，当然均値 

lx = E ( X 、 (4.2) 

也存在.于是，我們很自然地引进随机变量与其均値之差 X —户 
来代替随机变量 X . 因为 o — M ) 2 < 2 ( X 2 + 〆 )， 故 E ( X 2 ) 存在 
时 X — / X 的二阶矩也存在.我們有 

E((X — ft ) 2 ) = — IfiXj + fi 2 ) Kxi ). (4.3) 

把右边分为三个单独的和，于是得知它等于 E ( X 2 ) - 2^ E ( X ) + 
〆 = E ( X 2 ) — 〆 . 

定义. 設 X 为具有二阶矩 E ( X 2 ) 的随机变量.且令户= 
E ( X ) 为其均値.我們定义数 H 

Var(X) = E((X — ju) 2 ) = E ( X 2 ) — p . 2 (4.4) 

为 X 的方差，其正的平方根（或者 G ) 叫作 X 的标准差. 

为簡单計，我們常常說一个分布的方差，而不說及随机变量. 
“离差”是現在通常采用的术語“方差”的同义詞. 

例. （ a ) 若 X 各以 V 2 的槪率取値 ± c ，則 VarCX ) = ^ 2 . 

( b ) 若 X 为一个均勻骰子上面所刻的点数，則 Var ( X ) = 

丄(I 2 + 2 2 + • ■ • + 6 2 ) — (7/2) 2 = 35/12. 

6 

(c) 对于普阿松分布〆々； A) 来說，其均値为 A [参看 （3.b)], 
因此其方差为 Ek 2 p(ki A) - ；. 2 = XYskAk - 1 ； U —v = 

又2(々 一 i ) p (是 一1;又）+ Ay . pCg —1;又）一 a ~ =义 2 + 又一义 2 =又. 
在这个例 f 中，均値与方差相等. 

(d) 对二項分布来說[参 |K3.a)], 經过类似的計算得出其方 

差为 
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2々 2 办（々； p) — (.npy — 々办 （々一 1; n — \ , p) — (np) 2 = 

— np{{n —— l)p + 1} 一 = npq t 

方差这一槪念的用处是逐漸地会显現出来的，特別是与和极 
限定理（第+章)联系起来的时候.在这里我們会看到：方差是松 
散度的粗略度量.事实上，如果 Var(X) = : EU — /0 2 代巧）較 
小，則和中每一項都較小，从而对应于“使 U — 浏較大的”: c, 的槪 
率 fix ,) 較小.換言之，在方差小的时候，X与户之大偏差是不槪 
然的.反过来，方差大时，則X的可能値不会完全落在其均値附 
近. 

讀者們可以用下面的力学解释来帮助了解.假定一个单位的貭量分布 
在 r 軸上，使得在点巧集中了貭量 / Oo _) ,于是均値 P 就是重心的横坐标，方 
差就是轉动慣量.显然，不同的貭量分布可以有相同的重心和相同的轉动慣 
量，然而如所周知，很多重要的力学性貭可以用这两个量来描述. 

如果X代表一个可以測量的量，例如长虔或者溫度，則其 
数値依賴 于原点及測量单位.而原点与单位的改变就意味着把 
X变化到一个新的变量 aX +卜此处《和6都是常数.显然， 
Var (X + 6) = Var(X), 因而 

Var( aX + 厶）= a z Var(X). (4.5) 

原点及測量单位的选取有很大的任意性.不过通常选取均値作原 
点，标准差作測量的单位則是較方便的.我們在第七章中 E 經这 
样作了，当时我們引进了正則化成功次数 S„* = (S„ —邛)/(即《产. 
—般地，如果X 有均値与方差> 0)，則X - ^的均値为 
0,方差为/，因此随机变量 

x* 二 X - 一 芒 (4.6) 

a 

之均値为0方差为1,它叫作X的正則化随机变量.在物理学家 
的語言中，从X变到 X + 解释为引进无量綱的量. 

5. 协方差;和的方差 

設X与 Y 为同样本空間中的两个随机变量，則X + Y 与 
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XY 仍然是随机变量.它們的分布可以从 X 和 Y 的联合分布經 
过一些簡单的运算而得出.我們現在的目的是計算 Var ( X + Y ). 
为此我們引进协方差的槪念.它将在第8节里詳細地进行分析. 
如果 X 与 Y 的联合分布为{ 〆 々， n )}， 則 XY 的期望値由 

E ( XY ) = ^ Xjykpixj , y ^) (5.1) 

所給出，当然，假定右边的級数是絕对收斂的.由于+ 
y |)/ 2 , 故当 E ( X 2 )， E ( Y 2 ) 存在时， E ( XY ) 也存在.这时，期望 
値 

fi x = E ( X ), fiy = E ( Y ) (5.2) 

当然也 存在. 而且 X — …， Y — Fy 之均値都是 o . 至于它們的 
积，由第2节的加法規則，有 

E((X — Mx )(Y - ^)) = E ( XY ) - ^ E ( Y ) - 
— fi v E ( X ) + ft x p y = E ( XY ) — (5.3) 

定义. 我們定义 

Cov ( X ， Y ) = E (( X —/ x r )—( Y — 户 y ))= E ( XY )—(5.4) 
为 X ， Y 的协方差.当 X 和 Y 有有限的方差时，这个定义是有意 
义的. 

从第2节中我們知道 ，对 相互独立的随机变量来說，有 E ( XY ) 
= E ( X ) E ( Y )， 因此由（5.4)，有 

定理 1. 如果 X ， Y 相互独立，則 Co V ( X , Y ) = 0. 

注意： 其逆不眞.例如，閱看表1便知，那两个随机变量是不 
独立的，但是它們的协方差为 0. 在第8节我們还要回过来討論 
这一点.下面的定理是很重要的，对独立的随机变量来說，加法規 
則 (5.6) 仍然成立. 

定理 2. 如果 X l5 , X „ 为具有有限方差 • • • , <的” 
个随机变量，且令= X ：! + • * • + x „ ，則 

« 

Var ( S „) = Xj ^ + 2 2 Cov ( X " X 々）， (5.5) 

k — 1 j,k 

此处最后一个求和包括了 ( = j 对( X ,，乂0而/ <之 
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特別，如果 X , 相互独立， 則給出 了加法 規則： 

Var(S„) = s\ + al + ••■ + al. (5.6) 

i£. 令 n = E(X々）；?»« = Mi + ■•- + l^n = E(S„)， 則 
S „ — m „ = 2d - /M) 且 

(S n — m n y = 2(X々一/i々) 2 + 2S(X/ — /t,)(X々一"々)• (5.7) 
把 (5.7) 两边取期望値，然后应用加法規則卽可得出 （5.5). 至于 
(5.6) 的証明，只需应用定理1卽可. 

例. （ a ) 兮•布 { K々； ？*， #>)}. 在例 (3.a) 中，X々是相互 

独立的.我們有 E(X|) = 0 2 . 9 + I 2 • p = p，E(X々） = p ，因 
此，<5^ = — p 2 = pq . 且从 （5.6) 得知二項分布之方差为 npq. 
在例 (4.d) 中，用直接計算的办法 E 經得出同样的結果. 

(b) 乎亨可罕寧肀•白弩唧 K 寧.令 X 1 ,X 2 ,- -,X„ 为相 

互独立的 f 分•別以•槪•率 P 々和 q k ^ I - p k 取値1和 
0. 于是 E(X^) = p k , Var(X々） = Pk ~ p \ = Ph 9 k . 再令 S„ = 
X 1 + ■■■ + X n , 从 (5.6) 我們得到 

n 

Va.r(S„) = D pH (5.8) 

4=1 

如例 （l.e) —样，随机变量 S„ 可以解释为 》 次独立的試驗成功 
的次数，每一次試驗的結果或者成功或者失敗.于是 ? = (?! + 

• • • + pj/n 是其成功的平均槪率，很自然地，我們要把現在的情 
形和具有固定成功槪率 P 的伯努利試驗比較.这样一种比較可以 
得出一种很好的結果.我們可以把(5. 8 )写为 Var(S„)=^— 

其次，容易看出（用初等的計算或者簡单的归钠法），在全部滿足 
ZPK = np 的組{八}中，当所有的朽都相等时，达到它的最 
小値.由此推出，如果成功的平均槪率 P 固定，則当 Pi = ?2= ••- 
= h P 时， Var(S„) 达到最大値.因此，我們得到了一个很好 
的結果：以的可变性或者机遇的不一致性滅小了其随机起伏性 11 
(用方差来衡量的）.例如，一个城市中一年的火災可以考虑为一 


1) 更強的結果参看 [67]. 
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个随机 变量； 对于一个給定的平均数，如果每一戶发生火災的槪率 
都一样，則火災的变化性达到最大. 給定” 个机器的某一貭量平 
均 P ， 如果全部机器都一样，則产品最不一致.（把它应用到近代 
教育中去是明显的但是沒有什么用处 .） 

(c) fW. 一副具 有”张 标有号数的紙牌随机地排列，于是 
«!种排列 i 是等槪的.相合（牌在它們自然的位置)的数目是一个 
取値为0, 1，的随机变量 S B ， 其槪率分布已經在第四章中 
推导过.由它的分布我們可以得出!5„之均値与方差.不过下面 
的方法較簡单而且很有启发性， 

我們定义一个随机变量X*，其所取的値为1或0,当号碼为 
k 的牌在第々个位置时 X & 为1，反之\为 0. 于是 S„ = Xi + 

• - ‘ + X„. 每一张牌都以槪率 i/„ 出現在第々个位置.故 P { X ^ 


=1}=丄而 P{X^ = 0} = 因此 E(XJ=i . 由此 

w n n 

可知 E(S„) = 1,亦卽一副紙牌中相合数目的均値为 1. 为了 計 
算其方差,我們首先計算 X 4 的方差 


<A 


(钌 


—1 
« 2 • 


(5.9) 


其次我們計算 E(X, X *).积 X , X k 或者为0或者为1，且只有当 
号碼为/的牌在第 7' 个位置，号碼为々的牌在第4个位置时, X,X々 
才为 1. 这个事件的槪率为1/»(> — 1) .故 


E ( X , X ,) = , 1 ,, 

n\it 一 1 ) 


Cov(Xy, X 々） = — ~-——- • 
n\n 一 1) 

1 _ 1 
n 2 n 2 Cn — 1). 

(5.10) 

故最后有 



Var(S„) = n -■ — 1 斗 

- 2 「） 1 一 

1. (5.11) 

7» 2 

V 2 / n\n 一 1) 



从上面我們看到了相合数目的均値与方差都等于 i . 这个結果可 
以应用到第四章第 4 节中所討論的牌的猜測問題上去.那里我們 
考虑三种猜測的方法，其中之一就对应于合牌.第二种可描述为 
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槪率 p = 丄的》次 伯努利試驗序列.在这神情形下，猜对的期 

n 

望数为 rap = 1,方差为 = (n — l )/ n . 上述两种情形中期 
望数都是一样的.但 是第一 种方法却具有較大的方差，这就表示 
围繞着均値有較大的偶然起伏，从而游戏可能較为紧张些.（对于 
較复杂的紙牌来說这两种方差之間的差別稍为大一点.但幷不怎 
么大. ） 对最后一个猜測模型来說,猜的人保持呼喚同一张 牌; 猜对 
次数永远是1，而偶然性的起伏完全消失(方差为0 ). 我們看到， 
呼喚的策略不会影响猜对的期望数.但是它对偶然性的起伏的大 
小却有一些影响. 

( d ) 假定一个总体由&个黑元素与 g 个綠 

元素祖成，而定由 k 中抽取一个大小为的随机样本（不可能 
重迭）.样本中黑元素的个数 s , 是一个随机变量，它具有超几何 
分布（第二章第6节），均値和方差可以由直接的計算而得，但是下 
面的方法是較好的.定义一个只取値1或者0的随机变量 x «， 当 
样本中第々个元素是黑元素时 X & 为1 U < r )， 否則为0.由 
于对称性的原故， X * = 1的槪率为 b/{b + s '), 从而 


E(XO 


b 

A + 公 ’ 


Var ( X ,) 


bg 

(3 + £ ) 2 


(5.12) 


其次，如果/#々，則当样本中第丨个和第々个元素都黾黑时， 
X ； X t = .l ,否則 X ; X t = 0. X ; X * = 1 的槪率为 氏 b g) 


x (》+ e — 1). 因此 


E ( X ; X ,) = 


bjb — 1) 

{b + s){b + g — l )* 


Gcv ( X , X *) = 


_ —bg _ 

(b+gy{b + j? •— 1)* 


(5.13) 


所以 
E ( S r )= 


Var ( S ,) 


rbg \ 


b + 




(5.14) 


在有放回的抽样中，我們仍有同样的均値，但其方差稍为大一点， 
其方差为 rbg/ib + g y . 
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6. 切比謝夫不等式 1 1 

曾經指出过，小的方差表示与均値的大偏差是不槪然的.这 
一事实由切比謝夫不等式而变得更精确了.这个不等式是一个很 
有用而且很方便的工具. 

定理. 令X为一个具有均値 戸 = E ( X ), 方差 
的随机变量.于是对于任一 ^ > 0,都有 

P {| X -^| (6.1) 

r 

証.方差是由 (4.3) 中的正項級数所定义的.所以除去使 
U, -ju| < r 的那些項以后，不会使級数的値增加.故 

^ — f^yfCxj), ( 6 . 2 ) 

此处的星号 （*) 表示在求和时只对使 k, - n \> t 的那些 y 来求 
和.故显然地有 

— f 0 2 f ( x ,) > = PP{ IX -/ i| >4. (6.3) 

这就証明了我們的定理. 

切比謝夫不等式作为一个理論工具比作为估計的实际方法要 
恰当 —些，其重要性在于它的应用普遍性.但是不能希望很普遍 
的命題会对一些个別情況給出深刻的結東. 

例. （ a ) 令X为撒一顆均勻的骰子所得到的点数，則户=7/2, 
<r 2 = 35/12 [参看例 （4.b)]. X 与户之最大偏差为 2.5 〜 3< r/2. 
| X -/ x | 大于这个偏差的槪率为0,然而切比謝夫不等式仅仅断定 
这个槪率少于 0.47. 

(b) 对二項分布{〆々； 7*， p)} 来說，我們有 /t = np , cr 2 = npq 
[泰看例 （5.a)]. 对于大的》我們知道 

P { | S „ — np I > x ^ npqy ^ 2 } ^ 1 - 少 (a:) + 少（一 ar). (6.4) 
然而切比謝夫不等式只 指出： 左边少于 1/x 2 ; 显然，这較之 (6.4) 
来說是一个多么粗糙的估計. 

1) P. L. Chcbyshcv (He6biuieB, 1821— 1894), 
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*7. 柯尔莫格洛夫不等式 _ 

作为更精湛的方法的一个例子，我們 証明： 

令，•…， X „ 为相互独立的，具有期望値川= E ( XJ 及方 
差4的随机变量 .令 

S 々 = X ! + - •. + X 々， (7.1) 

且 

m k = E(S 々） = fj,^ + ••• + fi k (7.2) 

s\ = Var(S<.) = eTi + ■ • • 4 - a\ m 
对每一个 t > 0, 下面 》 个不 等式： 

ISj^ — 1 < ts a k = 1 ， 2,…， n (7.3) 

同时成立的槪率至少为 1 ~ *_ 2 . 

当《 = 1时，这个定理化为切比謝夫不等式.对》> 1的 
情形，切比謝夫不等式只对每个单个的关系 | S „ ~ m „\ C ts „ 的槪 
率給出了一样的界.故柯尔莫格洛夫不等式是比較強的. 

証.我們要估計不等式(入 3) 中有一个不成立的槪率\定 
理 断言： ^<厂 2 . 

定义〃个随机变量 t 如下.如果 

| S „ — | J :> ts„, (7.4) 

且 

| S 々一 对々=1，2，. .. ，” 一 1, (7.5) 

則 Y „ = 1;在其他一切祥本点上， Y „ = o . 卽是說， Y „ 在那些使 
得不等式 (7.3) 中第1；个不等式为首次不成立的样本点上为1.于 
是在任一特定的样本点上，諸 Y & 中最多只有一个为1，从而 Y ^+ 
Y 2 + ■■■ + Y„ 只能取値0或者1，当且仅当 （7.3) 中的不等式至 
少有一个不成立时它才为 1. 因此 

' x ^ PiY , + ••• + Y „= 1}. (7.6) 

因为 Yi +…+ Y „ 为0或者为1，所以< 1. 两边 
乘以 ( S „ — m „) 2 以后再取期望値，我們得到 

(7-7) 
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为了計算左边每一項的値，我們令 


U 々 = ( S ” - 历„) — ( S 七 一 w 々） = ( X v —〜）• (7.8) 

v =々 + i 

于是 

E ( Y ,( S n - m „ y ) 

= E ( Y ,( S ,- CT ,) 2 ) + 2 E ( Y , U ,( S ,- mO )+ E ( Y , Ul ). (7.9) 
然而只依賴于 X ^ +1 , • • • , X „ ，而 W , 只依賴于 X l5 -• 

X 々.故与 Y ,( S , - m ,) 相互独立.因而 E ( Y ^ U ^( S , -叫 ）） 
= E ( Y ^( S t — »1^))£(^) = 0 [因为 E ( U 々） = 0]. 故由 （7.9) 
推出 

E ( Y ,( S n - «„) 2 ) > ECY . CS , - ^) 2 ). (7.10) 

但是只有当 A —叫1 > h 时， Y 々尹0.故 Y t ( S * - m k y > 
t 2 slY k . 从而綜合 (7.7) 和 （7.10) 我們得出 

4 + …+ YJ . (7.11) 

因为 Yi + --- + Y „ 或者为0或者为1，故右边的那一个期望値 
等于 (7.6) 中所定义的槪率*.因此；《 2 <1,这就完成了我們的 
証明. 


1 .相 关系数 

令 X， Y 为任意两个具有均値~ ，心和 正方差 cr 2 ,, ai 的随 
机变量.我們引进如 （4.6) 中所定义的对应的正則化随机变量 
X% Y' 它們的协方差称为 X， Y 的相关系数，且以符号 fl (X,Y) 
表示. 利用 （5.4)，得到 

^(X, Y) = CovCX *， Y*) = ^ vC - X v Y J t ( 8 . 1 ) 

^ x^y 

昆然，相关系数是不依賴于原点与測量单位的，也就是說，对 
干任意常数 外， <* 2 , 办 1 ，办 2 (其中 fli 〉 0 ， a 2 >0) 都有 p(ajX + bi, 
a 2 Y + b 2 ) = ^(X, Y). 

陡用相关系数，无非是給协方差的书写来一个花样罢了 u .很 


1) 物理争家把相关系数定义作“无因次的协方差”. 
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不幸，相关系数幷沒有“相关”这个詞儿所暗示的涵义.从第5节 
我們知道，当 X . Y 相互独立时， p ( X , Y ) = p . 但是应該知道， 
其逆命題是不成立的.事实上，甚至当 Y 是 X 的函数时相关系 
数 〆X ， Y ) 也可能为 0. 

例. （3) 令 X 各以1/4的槪率取値±1，±2,且令 Y = X 2 . 

联合分布为 #»( — 1, 1) = f >( l , 1) = p (2, 4) = p {—2, 4) = —. 

4 

虽然 Y 对 X 有直接的函数依 賴性， 可是由对称性的原故 仍然有 
KX , Y )= o . 

( b ) 令 U ， V 为相互独立的具有共同分布的随机变量，且令 
X = U + V , Y = U - V . 于是 E ( XY ) = E ( U 2 ) - E ( V 2 )， 
E ( Y ) = 0,故 Cov ( X , Y ) = 0,从而 P ( X , Y ) = o . 例如 X，Y 
可以分別为两顆殺子的点数之和与差，則 X , Y 或者同时为奇数 
或者同时为偶数，所以 X ， Y 是非相互独立的. 

由此推出，相关系数幷不表示 X 和 Y 之間的依賴性的一般度 
量.然而 p ( X , Y ) 与 X 和 Y 的綫性依賴性是有关的. 

定理. 我們永远有 I^CX, Y)| < 1, 而且 KX ， Y) = ± 1 ， 
仅当 Y ^= aX + b 时才行，此处 a ， 6都是常数. 

証.令 X % Y * 为正則化随机变量，則 
V ar ( X *± Y *) = Var ( X ：! c )±2 Cov ( X \ Y *) + Var ( Y *)= 

= 2(1± / q ( X ， Y )), (8.2) 

左边不可能为負，所以 W ， Y )| <1. 若 〆 X ， Y )= l , 則必有 
Var ( X * — Y *) = 0,这意味差 X * — Y * 只能取一个値.卽是 
X * — Y * =常数.故 Y = aX +常数，此处 《* = 用同 

样推理可以証明 p ( X , Y ) = - 1的情形. 

9 .問 題 

1.七个球随机地分布在七个盒中，令 x , •为恰巧包含 f 个球的盒数.应 
用第二章第 5 节中所列出的槪率，写出 （ X 2 , X 3 ) 的联合分布. 

2 •擲两顆均匀的骰子.令 X 为第一顆骰子所出現的点数，而 Y 为两 ■ 
骰子中所出現的点数的最大者. < a ) 写出( X ， Y ) 的联合分布. （ b ) 求出均値， 
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方差，协方差. 

3•把一个錢币扔五次，令 X , Y , Z 分別为芷面出現的 次数; 正面連貫的 
个数和最长的正面連貫的 长度. 試把32个样本点和其对应的 X ， Y ， Z 的 
値在一起列一个表.而且用簡单計算导出（ X ， Y ), ( X , Z )，（ Y ， Z ) 之联合 
分布及 X + Y , XY 之分布.求出这些随机变量之均値，方差，协方差. 

4 .設随机变量 X !和 X 2 相互独立而且具有共同的几何分布其中 
々= 0, 1,….令 Z 为 X l5 X 2 之中的較大者[如果用符号来写的話，卽是 
2 = max { X !, X 2 )]. 推出 Z 和的联合分布及 Z 的分布. 

5.令 X !， X 2 为独立随机变量序列，且分別具有普阿松分布{>(彳；^)}, 
0(々； ^ 2 )}. 証明 x 〗 + x 2 具有普阿松分布 {#>(4; 〜+ h )}. 

6( 績上).在給定 Xi + X 2 的条件下 Xi 的条件槪率分布是二項分布， 

卽是 

P { X [ = ^( X ! + X 2 = n } = (9.1) 

7 .令 Xi 和 X 2 相互独立且具有共 局的几 何分布 £« V )( 如問題 4 ). 不必 
計算，直接 E 明在給定 X ! 十 X 2 的条件 下乂！ 的条件分布是均句的，卽是 

P(Xi = 々 jXi 十 X 2 = n) = - ^ -， ^ = 0, 1, •■*, ». (9.2) 

n + 1 

8 .令 X 〗，…，: x , 为相;£独立的随机变量，每一个都具有均勻分布 P ( X r - 

= 々）=丄，々=1，2, …， N . 令1；„和丫„分別，…， X n 中之最小者和 
N 

最大者.求出 14 和\^的分布.它和估計問題 （3. e ) 的联系是什么？ 

9.在估計問題 (3.0 中，求出最大和最小覌察値的眹合分布.特別,》= 2 . 
(提 示： 首先計算 P { X < r , Y >,}.) 

10 (績上）.求出在条件 X = r 下最初两个观察値为 > 和々的条件槪 

率. 

11 (續上）.求出 E ( X 2 )， 从而找出 Var ( X ) 当 W —0 O 的一个漸近表 
示式 （《 固定）. 

假定一批产品中废品率为幻而每一件被抽出来受检驗 
的槪率为 V . '因'此，我們可以把全部 产品分 成西类，卽是“接收了而且进行过 
检驗”，“接收了但是沒有进冇过检驗”，等等，其对应的槪率分別为#> 〆 ， P〆 ， 
“，叫，， 其中 ^ = l - P , 〆 =1 — 因此我們得到一串双重的伯努利 
試驗[参看第六章例 (9.0]. 令 N 为发現第一件庚品以前通过裣驗台的产品 
的件数(可以是眞正检驗过的，也可能是沒有检驗过的.）， K 为其中沒有被 
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发現(沒有检驗）的废品的件数.求出 N 和 K 的联合分布及边緣分布. 

13 (續上).求 E ^和 Cov(K, N). [在工业营业中，被发現的 

废品将要用合格产品去代替的，因此， K /( N + 1) 是其中废品的比例，它測量 
了这一批产品的貭量，注 意： E 与 E(K)/E(N + 1) 不一样 .] 

14•在一串伯努利試驗序列中，令 X 为从第一次試驗开始的連貫（成功 
連貫或失敗連貫)的长度.求出 X 的分布和 E ( X ), Var ( X ). 

15( 續上）.令 Y 为第二个連貫的长度.求出 Y 的分布和 E(Y),V ar (Y) 
和 X ， Y 的联合分布. 

16 .如果 X, Y 这两个随机变量中的每一个都只取两个値，而且 Cov(X, 
Y ) = 0,則 X 与 Y 是相:§：独立的. 


17.^0. 对一个拥有》个人的人羣，求出一年中恰有々个人出生的那 
些日数的'期'望値.〔一年取365天，而且一切排列都是等槪的 .） 

18( 續上).求出重复生日的日数的期望値.問》为多大时才能使这个 
期望値起过1 . 

19 •有一个人想开門.他共有《把钥匙，可以这样設想，他用它們去試开 
門吋所抽取的钥匙是相互独立的而且是随机的.求出試驗次数的均値与方 
差. （0 如果以前选出来的开不开門的钥匙不除去； 0) 与 O) 相反.（假定只 
有一把钥匙能打幵这扇門.淸确分布在第二章第7节中給出了，但現在这个 
問題幷不要求淸确分布 .） 

20•令（X, Y) 为随机 变量， 其分布为 (1.9) 所給出的多項分布.求出 
E(X), Var(X), Cov(X,Y). ( a ) 直接 計箅; （b) 把X， Y 都視为》个随机变量 
之和，幷应用第5节的方法. 

21 .把一个骰子擲》次，求出么点出現的次数和六点出現的次数的协方 

差. 

22 .在第六章問題24的关于野兽陷井的問題中，証明在第 v 次才 陷入陷 
井的野兽的个数的期望値为 叫卜 - 

23 .如果X具有几何分布 P(x = 々）= 0p (其中々=0，1，…），証明 
Vax(X) = gp ' 当 ••为正整数时，推出負二項分布 {/(«； r , p )} 具有方差 
rqp - 2 . 用直接計算的方差証明上述事实对全部 r >0 都对. 

24 •在 （3 .d) 的等 待吋間問題中，証明 

Var(Sr) = 十 + …+ (iV l7+r?}- ■ 


• 233 * 



提示： a 用在間題 23 中所得到的关于儿何分布的方差，附带地，当 v-> 
£» 时:我 們发現 N- 2 Var(S n ) = tt 2 /6. 

25( 續上）.令 Y, 为要求样本中包含 r 个指定的元素(代替課文中的任 
意 r 个不同的元素)所需之抽取次数.求出 E(Y r ) 和 Var(Y r ). (注意 ： Y r 
的分布在第二章問題 （11.12) 中曾求出，不过現在这个問題幷不要求用其分 
布 .） 

MU.AM： 相当大的数目）个人都去驗血.这可以用两种办法去进行 .（0 
每一个人都分別地去驗.这吋，要求試驗 A ? 次. （ H) 把从々个人中所抽出来 
的血混在一起进行分析，如果試驗是阴性的 ， 那么对这々个人来說只作一次 
检驗就够了.如果試驗是阳性的，那么必須对这々个人再逐个地分別試驗. 
这时对这々个人就須要作々+ 1次試驗了.假定对所有的人来說,試驗是阳 
性反应的槪率都是6而且达些人都是統計独立的. 

(0 从々个人中所抽出来的混合样本的試驗是阳性的槪率是多少？ 

(b) 在方案 (U) 下，所需要进行的試驗的次数 X 的期望値是多少？ 

(c) 为了使得在方案 (H) 下所需要試驗的次数X的期望値最小，々究竟 
应該怎样？不必要对《进行数値的計算，因为这个問題导出了一个关于々的 
較繁的方程. 

27.^^. 有一个由 r 类元素构成的总体，其中各类的元素的个数 
之比为 PI: P2: Pr. 有放回地从这个总体中抽取一个大小为”的随机样 

本.求出在样本中不包含那些类的元素的类数的期望値. 

28 •令X为 n 个 a 和 r 2 个 )3 的随机排列中 a- 連貫的个数.在第二章問 
題 （U.23) 铪出了 X 的分布.試求出 E(X ) 和 Var(X ). 

29•在波利亚罐子模型中[第五章 (2.c)], 当第《次試驗的結果是黑时 
为 I;結果是紅时 X 为0， 8E 明 P(x n ，X,„) = c/(i + r + r)， 其中 m=^=n. 

30( 續上）.令 S „ 为前 n 次抽取中黑球的总数（卽是 S„ = + 

X2 + … + x„) . 求出 E(S „) 和 Var(S n ). 

一个城市有》个区，其中住有 〜个届 民的区共有〜•个 
(«1 + +…= »). 令" 》= 为毎一区居民的平均数，且令 a 2 = 

- m 2. 随机地无放囬地选取 r 个区，然后把样本中每一区的居 
民的数目調査出来.令 ，…， X ,分別为这 f ■个区的居民数.試証 
E ( X t + …+ X r ) = fnrj 

0这个問題的栾源是在第二次世界大战中所发展出来的一种新技术.参看 [69J. 

在軍队中实行方案 （ii) 能节省80%. 
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Var(X, + 


+ X ,) 


a 2 r{n — r) 


(注意：有放回的抽样的方差較大，其方差为 d 〜） 

32 •呼举寧' 在灯平面上，有一个由"个环所构成的鏈（每一 
环的长度单^^长).相邻二环之間的夹角各以1/2的槪率取値土这 
里 a 为正常数.又假定各夹角是相5：独立的.鍵的长度 i ••是一个随机变 
量.我們要証明 


E(I4) = 


1 十 cos a 
1 一 cos a 


一 2 cosg 

(1 - 


cos^a 

cos a) 2 


(9.3) 


不失普遍性，我們可以假定第一个环落在正 r 軸的方向，第々个环和正 
: 軸的夹角为一随机变量 S 4 _„ 这里 S 0 = 0, S 4 = + aX k . 而 X 之是 

相互独立的随机变量，且各以1/2的概率取値土 1. 第々个环在两个坐标軸 


.h 之投影分別为 cosSp 和 sinS 々_ i . 

所以对有 


LJ = (2 cosS k ) 2 
v *-o / 

+ (§-s 4 ) 2 . 

(9.4) 

对 m<» 用归納法依次地証明 



E(cosS 霣 ） =; cos n CC 9 

E ( sin S n ) = 0， 

(£>.5) 

E (( cos S /rt )( cosS „)) = 

COS w-m a* E ( cos 2 S m ) 5 

(9.6) 

E (( sm S^X sin S n )) = 

cos n - WJ flf . E ( sin 2 S m ) ， 

(9.7) 

E ( LJ )- E ( LJ _,) = 1 

, 1 一 COS n_1 a 

+ 2 cos GT « 

1 — cos Ct 

(9.8) 


(^0 = 0)，从而最后得出 （9.3). 

33. —串伯努利試驗序列一直継續到出現》■次成功为止，其中》•是一个 
固定的整数.令 X 为需要的試驗次数.求 1 2) E ( r / X ). (定义导出一个无穷 
級数，但它有有限的表达式 .） 

34 .在把 r 个球放入》个盒的随机排列中，恰巧发規相个盒是空的槪率 
滿足第二章的递推公式 （11.8). 令为空盒的个数的数学期望値.从递推 


1) 这是化学中长聚合物分子的长度問題的二維类似.在我們的間題中随机变量 
L n 不能表为簡单的随机变景的和 .. 

2) 这个例子說明随意停止与不随意停止的 区別. 如果試驗的次数》固定，則成功 
次数 iV 与试驗次数《之比是一个随机变量，其期望値为 P . 然而，在我們的例子 
中，当成功次数厂固定，而所需之試驗次数 X 依賴于偶然性时，，与 X 之比的 

期望値就不一定是 P 了. 例如， P = ^■•时，对 r = 2 我們有 E(2/X)=0.614, 

而不是 0.5, 对 r = 3, 我們有 E(3/X) = 0.579. 
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公式証明 


m r+ i = 1 4- (1 一 n~ 1 )m r ^ 


幷且推出 


m r : 


- t ) }* 


35 •令3„为„次伯努利試驗的成功 次数.証明 

E 〔 jS „ — 即1) = 2 vqb { y \ n , #>), 

其中 v 为滿足 np<V^np + l 的整数. 

36 .令 (X^ 为相互独立旦具有共同分布的随机变量序列.假定 X* 只取 
TH 値而且 E(X^) = a 和 E(X^ 1 ) =： b 存在. 令 = X L 十…十 X„. 証明 

E ( s ^) 是有限的，而且 E ( x -fe/S fl ) =丄对々=1，2, 

n 

37( 績上 ) 1〕 . 証明 

E (~^~)=;，如果 <•»<»， 

E (» = 1 + (,» — n )aE(S^), 如果 m^n. 

38. 令X,, X„ 为相：£独立且具有共同分布的随机变量，令其均値 
为 m ，方差:为。 2 ‘ 令 X = ( X 1 + …+ X a)/». SE 明 2 ): 

」~rE ( 念 (X 4 - X)A = a\ 
n — 1 7 

39 . 令X,, 是相互独立的随机变量.令 U 为 X l} 的函 

数， V 为 x 4+1 , x „ 的函数 u <»). 証明 U, v 是相互独立的随机变量. 


40•爭序呼孝 f 夸吞哼準 令巾 (*) 在*>0的地方是一个单調上升 

的7£函数而且’假定-彐(<^乂’1)’)=财存在.証明 

冰命 

41 .轉琴 ( Schwarz ) 〒轉. 对于任何两个具有有限方差的随机变 
量 X 和 + 都有 E2(XY)'<E(X2)E(Y2). 由二次多項式 E(〔<x + Y) 2 ) 

非負达一事实証明上述不等式. 


1) _习題37可由习題 S 6 推 g 的竟見是由鍾开萊提出的， 

2) 这可解 释为： S ( X 广 X) 2 /(« - 1) 是沪之无偏估 计量 . 
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問题解答 


第一章 

l.(a) 3/5 ； ( b ) 3/5 ； (c) 3/10. 

2 •事件 Si ， S 2 , S ! US 2 以及 5 iS 2 分別包含了 12, 12, 18 和 6 个点. 

4. 这个空間包含了两点和 TT , 其对应的槪率各为 I / 4 ;包含了两点 
H 7 T 和 THH, 其对应的槪率各为1/8； 一般地包含各具有槪率厂"的两个 
点(»>2).这些槪率之和为1,因此不需耍考虑无穷的拋■的序列的槪率. 
我們所耍求的两个槪率分別为1 5 /1 6 和 2/3. 

9.P{^B> = 1/6, P{A\JB} = 23/36, P{^B , } = 1/3. 

12 .在 事件(>)， （ b ) 和 ( s ：) 中 ， r = 0. 

在事件 (e )， （ f ) 中，^ = 1. 

在事件 ( d ) 中 ， x = 2 . 

在事件 ( c ) 中， * = 4. 

15. ( a ) A; (b) AB; (c) BU(AC). 

16 . ( c ), ( d ), ( c ), ( f ), ( h ), ( i ), ( k ), (1) 是对的.除非 CCB ，（ a ) 是 
无意 义的. 甚至在这一情形下，一般也是不对的，伹是在特殊情形 Cc = B , 
JC = 0 下，它是对的.如果 C 3/ B ， 則⑻是对的. （ g ) 应該是 HUB )— 
A'B. 最后，由于 ( k ) 是对的故 （ i ) 不对. 

17. ( a ) AE'C'\ (b) ABC r ', (c) ABC ； (d) A\JB\JC ； (c) ABU^CVBC ； 

(t) ( g ) ABC'[JAB , C\JA , BC= (JB\JyiC\JBC)-ABC; 

( h ) A'B'C'-, ( i ) (ABCY. 

1S.AUBHC = AU(B — AB)U{C — C{AUE)} = AUBA'\JCA'B\ 

第二章 

l.(a) 26 3 ； (b) 26 2 + 26 3 = 18,252; (c) 26 2 + 26 3 + 26 4 . 

2-64-14 == 896. 对具有 a 2 个区域的棋盘来說，公式为 ” 2 ( 2 ” 一 2 ) . 

3.2(2 10 — 1) = 2046. 
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，/ «\ , «(» + 1) 

4 A 2； — —- 

5. ( a ) 丄； ( b )- - 1 - - 

” n(n — 1) 

6* (a)n = 0.01, P 2 = 0.27, p3 = 0,72; (b)pi = 0, OOt, f-2—0.063, 
P3 = 0.432, P4 = 0.504. 

7- Pr = ( I 0 ) r I 0~ r . 例如 p 3 = 0.72, pio == 0.00036288. 史特令漸近 
公式給出 fu )= 0.0003598. 

8. ( a )(9/ l 0)^； ( b )(9/ l 0)^； ( c ) (8/ l 0)々；（ d ) 2(9/10) 々一 （8/10) 之; 

( c ) 仙和 A {} B m 

0!»-' 

11. 恰为 r 次試驗的槪率为(”一 l ) r - l - r ( n) F = 

12. ( a ) l / l -3.5 …（2» — 1) = 2"«!/(2«)!； ( b )( n !)/ l *3 … （2 n — 1) = 

O . 

13 •假定它具有随机性，則 12 次接見訪問全部都在星期二或者在星期四 

的槪率为（ 2 / 7 ) 12 =0.000000 3 "_.只有 (D = 2 i “ 对天”,所以卽使对任意两 

天来說，这个槪率仍然很小，因此，有理由說接見訪問的日子是有一定的規 
定的. 

假定它具有随机性，此事件的槪率是，近以于沒有可靠 
的結論是可能的. 

15-(90) io +(100 )io = 0. 330476 …. 

16.(251)(5!)~ 5 5~ 25 = 0.0020 W ' 

17 2 (n—2)f(> — r — 1) ； _ 2(n — r _ 1) 

n J n{n — 1) • 


19 •槪率为 1 一 =0.517747 …和 1 —=( K 4914 C ^“. 


20. ( a)(n — N ) r - b ( n ) r ; ( b)(l — N / ff ) r . 对于 r = N = 3 时，槪率为 
(a) 0.911812*--； (b) 0 ■ 912673 … .对于 r = N ^= lQ 9 它們是 （ a ) 0*330476； 
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(b)0.348678 … • 

21. (a)(l — /V/«) r-1 ; (b)(») t vr+((»)N’) r . 

22. (1 — 2 / n )^- 2 ; 中位数近似地等于 2 r+l = 0.7«. 

23 . 假定它具有随机档^三个或者四个都是 ( a ) 某一个女孩打破的； （ b ) 最 

年輕的女孩打破的槪率分別为^ = 0,2和 1 = 0-05. 


24. (a)l2T/l2 12 = 0.000054; ( b )(2 2 )(2 4 — 2)12* 6 = 0.00137--. 


^ wCe 2 ) 12 " 30 - 0 ' 00035 " - - 


d > 2 H ; 

⑷ ( m :). 

dd . 

28 . ? OG》( 2 ㈣ 1/2 . 

… _(;) d )©_ ( n ) 

― ■ 1 — " ■ 

(lDGs)GD Cu) 

30 .参看問題 29. 其槪率为 

/ 13 V 39 yi 3 — m \/26 -h ^ \^/ 52 \/ 39 \ 

V »* Ai 3 — mA » A 13 — « / ' \ X 3 Al 3 /* 

© SXS ) 


33 . 0)2 钟 （ 5 , 4 , 3 , 1 ); (咖（ 4 ,今， 4 , 1 ); ( c ) l 2 p ( 4 , 4 , 3 , 2 ). 


34. 


⑺ CX 3 X 


!/) 


(S 


[关于一付牌含有某神花色的牌 a 张，另一种的 


b 张，等等，这一事件的槪率，参看問題 33 .] 

35-Po(0 = (52 — ^)^4 - (52)4 ； pl(r) = 4 广 （52 — #*)3+(52 〉 4; Pz(r ) = 
6*-{r — 1)(52 — r 〉 2 + (52)4; P3( r ) = 4r(r — l) (r — 2)(52 — r) -f (52 ) r ； 
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P4(r) = 0)4 + (52)4. 

36 .第1，，_ ■，第 4 个爱司的等待时間超过，的槪率为 ^ l (^) = Po { r )； 

w 2 (r) = po{r) + Pl(r) ； w^{r) = po(r) 十 Pl(r) 十 P2 (’）； «"4(0 = 1 一 

p 4 (r). 其次， j ； {r) = tvi{r) — w;{r + l ). 中 位数为 8, 20, 32, 44. 

37 _ ( a )( 々)《)( 52 r 0, 其中衫 2 ; 

⑻ {( a 4 二) d ， 其中⑹ • 

39 . (ri+ m 

40-( ri + 5 )( r 2 + l ). 

41 (n + r 2 + r 3 )\ 

' ri \ r 2 lnl • 


42.(49)4+(52)4. 
43_ P (⑺） 


= 10-10" 7 


= 0.000 001. 

P ((6， l )} 

= 10-9-( 7 6 ) l 0 -7 : 

P {(5,2)> 

-10! . 7 ! .10-7 

8! i ! l ! 1!6! 

=.000 063. 

= io *9.( $ ) ur 7 

一 io ! . 7! . 10 -, 

8!1!1! 2!5 J 

=.000 189. 

P {(5,1,1)} 



= io -( D (;) 2 - 10-7 

- io ! • 7 ! . 1[r 7 

7!2! l ! l ! l !5! 

=.001 512. 

P {(4,3» 



= 10.9.( = ). 10 -7 

= 10! _ 7! . ^ q -7 

8 H ! l ! 314! 

=.000 315. 

P {(4,2,1}> 



= 10.9.8.( J )(^).10- 7 

- io ! _ 7! . lp _ 7 

7!1!1! 1!2!4! 

=.007 560. 

P ((4,1,1,1)) 



= io - GX ;) 3 . 2 . 10-7 

- 10 ! . 7 ! . 10 -7 

6!3! i ! i ! i !1!4! 

=.017 640. 
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P {(3,3,1)} 

OCX 】） 10 _ 7 

P {(3,2,2)} 

P ((3,2， l ， l )) 

P {(3,1,1，1,1)) 

= 10 ( 9 4)(;) 4 - 3 . 2 ，— 7 

P {(2,2,2,1)} 

OGXDG ).， 7 

P {(2,2,1,1,1)} 

KUD . 2 . 1 。 

P{(2,1,1,1,1,0} 

= io ( D . 4 . 3 ' 2 . 1(r7 

p {( i , i , i , i , i . i > i )> 

^Oe.'s.—sc.icr 7 


一 吨 _ U _• ur 7 = .005 040. 

712 T 1! 1!3!3! 


一 10 ! - 7 J — . 10" 7 = .007 560. 

7!2!1! 21213! 


— 1Q ! - U - 10-7= . 105 840. 

— 6!2! l ! i ! l ! i !2!3! 


10 ! _ U _ lo -7 = .105 840. 

5!4!i! 1!1!1!3! 


10 ! ■ 7 ! _- ；0- 7 = .052 920. 

61.3 U ! 1!2!2!2! 


一 10! - 7! _ .10-7= .317 520. 

—5!3!2! 1!1!1!2!2! 


— l °! _ 7 J - -10- 7 = .317 52D. 

—4!5!1! 1!1!1!1!2! 


10! -7 ， -1 Q ~ 7 = .060 480. 

3!7! - 


44 ■令 h D,T, Q 

分別表示一重，二重，三重，四重，則我們有 



P{ 22 S} 

= 365! -365 _22 — 1 

22[343! 

0.524 

30. 

P{20S + IO} 

__ 365] 

.2 2! .365—22 = 

.352 

08. 

— 20!1 T344! 

20!2! 



P{18S + 2D} 

3651 

. 22! .S65* 22 = 

.096 

95 # 

— 18J21345! 

18!2!2! 



P{16S + 3D} 

__ 365! 

• 22! -365" 22 == 

.014 

29, 

—16!3!346] 

16!2!2!2! 



P{19S + IT} 

一 365! 

22 - -365 -22 — 

.006 

80. 

19J1T345! 

19J3! 
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P{175 + ID + IT} 
P { l 4 S + 4 i >} 

P { l 55 + 2/? + 1 丁） 

P{185 +■ U)} 

4 5 .令 q = ( 5 5 2 )= 


一 365! 

- • 22 ! .365 - 2: = 

= .003 


17 ； 1]1 ： 346! 

19!3! 



- 365 ! 

221 -365~ 22 = 

= .001 

24. 

H341347] 

H]2T2]2T2 J 



_ 365! 

-• 22! •365 _22 - 

=,000 

66. 

15 ； 2111347? 

15!2!2!3! 



一 365! •_ 

22 ! -365-^ = 

= .000 

09. 

18]1)346] 

18MJ 




2,598,960. 槪率为 (a)4/g; (b) 13 * 12• 4• ； 


(c) 13 * 12,4 * 6w " 1 = ? 4 ; ⑷ 9 . 45 . 厂 1 


88 


4165 




13*6*6* 4 •彳 _ 


. 198 
4165 


(O 

； (&)13_(、 2 ) -6'4 3 *^ -1 = 


• 42.^-x 

1760 

4165* 


第四車 

1.99/323, 

2.0.21 …‘ 

3.1/4. 

4-7/2 6 . 

5.1 /fU 和 31/6 S . 

6 .若 4 为事件 (々，《) 不出現，則由 （1.5) 有 

7 •令? - 1 =(13),1115, = O & = ( ! 2 3 )( V )^ 5 * = 40.0 
近似馗为尸 ro] = 0.9658; Pfi] = 0.0341； P t2 ] = 0.0001. 

8 *，"= 

iV 

9 ‘ Pr = 2(-0 4 (^)^~^. 关于两个公式的一致性的 IE 明，請参 
看第二章 (12.18). 

10 •—般項为 《 U ^ 2V a ； V /^ v ， S _(々 l ，々 2 ，，-，々 w ) 为（ 1 ， 2 ，*•，， iV ) 的一 
个棑列.对于 对角元素來說 V . 
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12. tt r — 




( 如一 ks) r 

i ns )r • 


14 •注意：由定义知，<» 时 《 r = 0， 且 «„ = n \ s n j { ns) nm 

n 

15. «, — u r ^ x = V ( —1)^-1 ( n ~ 1^ {ns — ks) r _ x 
*Tl 、々一 l/ 7 „/_ l) r _! 


n • 应用 ( 5 5 2 )& = (J)( 52 13 ^). 則近似地有 f[ 0 ] = 0.264, 

0_5S8 ， f r2 ] = 0.146, P [3] = 0.002. 

18 • 应用 d) S/i = (^)(13 — 2^)* 則近似地有 P[0] = 0.780217, 
^ri] = 0.204606, P lZ] = 0.014845, P [3] = 0.000330, P [4 i = 0.000002. 

N^m 

IS , m \ N \ u m = (一 1)々(2 V — m — 々)！/々！• 

*»(• 

2 ◦. 参看下面的公式 ( 对 r = 2 的情形 ). 

21. (rN)\x = 0(rN — 2、'. — (f)r 3 (WV 一 3)! -+ 

+ ( — l) N r N (rN 一 N)l • 

( n ) „_ m 

24. P {m] = ― Yll _V(_!)^ n 

(„ +:-i 戶 、 ； w A 

25 • 利用第二章 （ 12 .16) 和 （ 12 .4). 

26 . 令叫 = 41) … LMiv 幷注意 i//v + i=I/ w LM.v +1 和 U N A N+l = 
(■^ljw+i) U … U (- <4iv-^iv+i). 



第 五 




2- p = 


10-5 9 
6 10 - 5 10 


^ 0 • 61 •• •. 


章 


3 - ( a ) GX 】)= o . 182 ."， 恰有一个爱司的槪率为4-(^)-^(^)= 
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( Mil …； （ b ) 近似地为 1 — 0,182 — 0.411= U .407, 


4. (a) 2- 


125 


^23\ 


/23 、 

U0/ 一 

= — ； (b)2 - 

Vl2, 

726 \ — 

50’ 

? 26 - 

U3 / 


\13, 

140 . 

so 


345~ ? 

345 * 



13 


20 

21 


VI ) 2 . 


13- ( b ) i -; ( c )2 ".(l + 2 «)~\ 

14. ⑷令 — y , h = y” — +， = sr* — +，貝 y |i7”| 十 


\^n\ + u »|= 4"( l fl »+ll + \ b n+l\ + 1 〜 +tl}, 因此， + 1办„| + 1〜| 几 
何級数地上升. 

15. P = (1 — Pl)(l — P2)---(l — Pn). 

16•应用不等式1 - *< e --(0<^< l ), 或者 lo K (l — *) 的泰劳級数； 
参看第二章 （8.12). 


19 .如果不管卜 r 和^这个事实对第《次抽取是对 的話， 則在第》+ 1 
次試驗是紅的槪率为 

b ^ b c f ^ b — b 

b r b r c b r b r c b r ' 


20 .前面一个問題說明，这个論断对》:= 1 和一切》都是正确的.由归 
納法，考虑第一次 試驗的 两种可能性. 

23.利用第二章 （12.9). 

26.)K{S.2)2v = 2?(1 - p) 
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28. (a)f<2 ； (b)« 2 + uv + k 2 /4 ； (c)n 2 + (25 抑 + 9^->rvw + 2 ⑽ 

33. ?I1 = p 32 = 2pi\ = P, PU = P33 = 2p23 = 9, = P3\ = 0, P22 — 


第六章 

1,5/16. 

2 . 其槪率为 O . OMtH -... 

3. (0.9)*<0.1, at >22. 

4. 和 （1 — 其中= ( 4 9 8 ) + ( g ) •因此分別为 


和 x ^ 66 , 

5.1 —(0.8) 10 -2(0.8) 9 = 0.6242. 

6. {l— (0.8) 10 — 2(0.8) 9 }/{l — (0.8) l0 }=0.6993. 

7 . ©GD+GD =d . 003954 …和 QD^^ 0 - 00952 '"- 

s . O -6 - 2 . 12-6 ). 

9 .芷确的値为…，0. 4 01 87 …和0_ 2 00 9 …；普阿松逼近为 

1 — cT 1 = 0.6321 …, 0.3679 …和 0.183’". 

oo 

I 。 •厂 2 2 2 V 々！ = 0 . 143 …. 


11. 2 1/ 々！ = 0.080 …. 

3 

12. ^ 10 °^0.05 或者 ^^300. 

13 • 厂 1 = 0.3679***, 1 — 2-e~ l = 0-26 恥_、 

14. r^^O.Ol, 05. 

15- 1/P = 649,740. 

16- 1 — 〆 ，其中户= Ko ; 入）十…+ p { k ; ^). 

1.8 • 当 k = 0 为 q 3 ; 当 々 =1 ， 2, 3 时为 M 3 ; 当々 =4 时为 M 3 - P9 6 . 
队 ±( i ) 2 ^=( 2 ：) 2 —(+„r 对充分大的 "- 


20> ^ C + 这也可以写成另一形式: 
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A — 1 

pa 2 ( fl + J ~ 其中第々項是第 a 次成功发生在第*</， 一 1次失敗 

以后的槪率. 

21 一 m . 2 — 1 - 

22. ( a ).:= 2^ 2 " r_1 = 21系 ( 2 N N 二 1 厂 r );( b ) 应用第二章(12_6). 

23- k\2^np x p 7 这吋 n 二 k'kzlkn. 

24 . CTi)( n : J1 )** , ( n : Jr_1 ) ， w … 1 — ") ， 其中 " = ”！ + •.•+ 

25. p = P\q2{p\92 4 - PzqxY 1 , 

31 . 由对数的泰劳展开 

厶 （0; »， f) = = (1 — ^/n) n <e~ x = p(0, 久）. 

对每一个分布来說其各項之和为1，因此，不可能有这样一个分布，它的各項 
都大于另一个分布的对应項. 

32. 普阿松分布中只有有限多項大于 e， 其余各項支配二項分布的对应 
的項. 

第七章 


1. 如第1节一样 进行. 

2. 应用 （1.7). 

3-^(— 1^)= 0.143〜. 

4.0.99* 

5.500. 

6.66,400. 

7 .更确切地.第六章的不等式足以 說明： 超过8倍标准差是很不可能 

8. (27r»)'i{p 1?2 (l 一 P1 — p 2 )}~ 1/2 . 


第八章 

I - J 3 = 21. 

2. r = pH qv Jr rw ， 其 中“， 《/， w 为下列方程組的解: 
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u = p a_1 {qv rw ^ ^ -， v = {pu + rw )-- —疗戶 —， 

1 — p 1 一 q 


叫十彳 t / + 


P a ~ X + (^ +• rw) 


P a ~ 


v = + ru/S ) - - - 9 ^ = (f>“ + qv) - • 

1 — q 1 — r 

4 •注 意： K A n }<{ 2 p ) n , 但是 

P{^„}>1 — (l — P »)2"/2» >1 _ e ~{ 2 p ^/ 2 n _ 

如果 P = ^ ■，則最后一个量如果 P > 1 , 則 P {>„)〒 会趋于 0. 


第九章 

1•可能的組合为（0,0)， （0, 1), (0, 2)， （1, 0), (1, 1), (2, 0), (2, 1), 
(3, 0). 它們的槪率分別为0.047539， 0.108883, 0.017850, 0.156364, 
0.214197, 0.321295, 0.026775, 0.107098. 

2- 0) 肤合分布可以写成6行6列的矩陣.其主对角綫上的元素为分， 

1 < i , 其中9= 主对角綫一边的元素全为0,另一边的元素全 

为々. ( b)E(X) =7/2, Var(X) E(Y) = -^-, Var(Y) = 1 ^ 1 , 

1 I i6 1x96 

Cov(X, Y) =导 

3 .在X， Y 的联合分布中，其各行为以32 - 1 乘(1，0, 0, I)， U, 0)，（0, 
5，4，3，2，1)，（0，0，6，6，3，0)，（0，0，0，1，0， 0); 

对 X，Z 的联合分布来說，其各行为32- 1 乘（1，0, G， 0, I)， 0), (0,5, 
6，1 ? 0 ? 0) > (0，。，4，6，1，0)，（0，0，0，3，2，0)，（0，0，0，0，2，0〉， 

(0, 0, 0, 0, 0, 1); 

对 Y， X的联合分布来說，其各行为32< 乘(1， G， 0, 0) 5 (0, 5, 6 , 1)， 
(U， 4，7， U)， （0，3，2， t))， （0，2，0，0)，（0，1，0， 0). 

X + Y 的分布为（1，0, 5, 4, 9, 5) 除以32,而 X 十 Y 的値从0到 

6； XY 的分布为（1 3 5 3 % 3^ 1, 6, 0, 3, 1) 除以32, XY 的値由0到 y. 

E(X) = 5/2, E(Y) = 3/2, E(2) = 31/16, Var(X) = 5 /4 5 Var(Y) = 3/8, 
Yar(Z) = 303/256. 

P(z = /，X = ,) = / P{2 =z ? X= 7}=(1—r '=/； 
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其它的値是不可能的. P{Z = 2 } = 2 ^p — q Zi p — q 2 i +1 P m 

8. \的分布由 （ 3 . 5 )所給出由于对称性； U „ 的分布同祥可求出, 

9- P { X < r ， 对 r ^ s 9 


P{X = r 3 


y = — y + i )« — 2 (r 〜)《 + ( r —”)， 


r>s 


10. x ： 


r tt -2 — 


D fl - 


r « — (r — 1)* 
r n ~~2 


若 且 k < r m 


r » — ( r — 1)* 


若 j ^ r 和々 = ，或者 ；= r 和 々彡 r . 


太 = 0 若 j > r 或者々 > r 


U . O 2 ^ 


,_ nN 2 

O + 1) 2 (» + 2)* 


12. P{N = », K = 々 } = ( = ) 

P(N = «} = (1 — ^P f ) n qp\ 

p { K =々）= (仰 ') — 》(—= pWK 


13 - E ( N =27^^, „/(« + !) — q 2 p q 


SO - 士)(一 , 产 1 


_ W _ p 2 pW , i 
1 一分 p’ (1 — W <ip* • 

E(K) =<; E(N) = (l T-?.£.l ； 

P qp 


Cov ( K 5 N )= 


p(K, N) 




(1 _《 〆 ） 



H. PH=P^q + E(X)=p^ _1 + <yp -1 ； Var(X) = pq~ 2 + qp^ 2 — 2. 

15 - = p 2 q^~ 1 4 - q 2 p ^； P{X = r», Y = n} =r p m ^ l q n g m+1 p » ，其 

中 m 9 n ^ l ; E(Y) = 2； a 2 = 2 {pq^ 1 + qp~^ — 1). 


17*( = ) 364 a _ ^365 1 ' n . 

18. ( a ) 365(1 — 364 ff -365 -ff — n 36^ 1 -365" n }； ( b ) ”>28. 

19- ( a ) ^1 == n 3 <3 2 = (73 — l ) w ； ( b ) /u = (n 十 1)/2，0 2 =( n 2 —1)/12. 
20. E ( X ) = np \； Var ( X ) = np \{\ 一 p \) ; Cov ( X ， Y ) 二 — np \ p 2 , 
2 l --«/36, 这是問題加的一个特別情形， 
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第十章大数定律 


1. 同分布的变量 

在第七章和第八章中导出的伯努利试验的极限定理是一般极 
限定理的特殊情况，后者我们不能在本卷中论述.然_而，为了揭示 
随机变量期望值的新特征，此处我们至少将讨论大数定律的某些 
情况. 

'当我们考虑”次伯努利试验的成功次数 s „ 对于 n 的依赖性 
时，就可以比较清楚地看出伯努利试验与随机变量理论之间的联 
系.对于每次试验， s a 增加1或0,故我们有 - 

S„ = X, + X 2 + • • • + X,,, (1.1) 

此处当第々次试验出现功时 X & 等于1，否则 X ;等于 0. 于是 
s a 是”个相互独立的随机变量之和，其中每个变量分別以概率 P 
与《取值1与0.—个直接的推广是考虑形如 （1.1) 的和，其中 
X * 是具有同一任意分布的独立随机变量.第六章第4节的(弱） 
大数定律所陈述的是，当》很大时，平均数3„/«多半是接近 P 的. 
这是下述定律的特殊情 况：. 

大数定律 .设{ X ,}是独立同分布的随机变量序列.如果期 
望值 (I = E ( X ^) 存在，则对于每个当吋，有 

P { X i 土 … +X » -p > e } — 0; (1.2) 

n J 

即，平均数 SJn 与期望值之间的偏差小于任意给定的 S 的概率趋 
向于 1. • 

最先在上述一般情况证明这个定理的是辛 钦1 旧的证明必 


1) 参见[1】.关于这个定理的应用范围，请读者参看第六章第4节末的注意. 
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须引进方差 VarCXJ 有限这个不 卜 必要的限制汽而在这种倩 況下， 
我们有如下的精密得多的结果，它是伯努利 M 验的#模佛-拉普拉 
斯极限定理的推广，并称为 

中心极限定理 .设{ X ,}是独立同分布的随机变量序列.假 
定 jtt = E ( X 4 ) 与 cr 2 = Var ( X 々） 存在，并令 S „ = X ! + …+ 
x », 则对于每个固定的 a ’ 

P — _， (1-3) 

此处 <PO) 是第七章第1节引进的正态分布涵数.这个定理是麟 
德堡 （Limleberg) 证明的 [2] ;在此之前，李雅普诺夫 （JlanyHOB) 及 
其他作者曾在更强的限制条件下给出过它的证明.必须了解，这 
个定理仅仅是一个更一般的定理的特殊情况，后者我们推迟到第 
二卷中讨论.此处我们注意， （1.3) 比 （1.2) 强，这是因为它给出 

了偏差 丄久一户大于— 的概率的一个估计.另一方面，大 

n • 

数定律 （1.2) 在随机变量 X & 不具有有限方差的情况下也成立 ，故: 
它比中心极 限定理更一般由于这 个/ 缘故我们将给出大数 定律一 
神 独立的证明， la 我们先每例来说明 i 两个极限 定理. 

例. （a) 在独立掷一颗对称骰子的序列中，设表示第々次 
• 投掷时出现的点数•则 E(X^) = (1 + 2 + 3 + 4 + 5 + 6)/6 = 
3.5, Var(X 々) =( I 2 + 2 2 + 3 2 + 4 2 + 5 2 + 6 J )/6 — 3.5 2 = 

大数定律所陈述的是，当〃很大时，平均点数 S„/« 多半和 3.5 很接 
近.中心极限定理所陈述的则是， |S a — 3.5«| <a.(35«/12)t 
的概率大约是少(《) — 当《 = 1000, «= 1时我们得 

到， 3 45 0 <S B < 3550 的概率大约是 0. 68 .令 ce 取中位值 a = 
0.6744, 我们得到, .S a 位于区间 3500±36 之内和位于此区间之 


1) 马尔科夫 （ A . A . MapKOB ) 证明 ，对 于某个 a > 0, EC | X *|'+0 存在就够了 •- 

2) 我们称使得 iS „ -3.51 < a • (35»/12) W 的概率等于 0.5 的 a 为中位值 .. 

此时有金 （《) — — a ) = 0. 5 5 cc = 0.6744, u - (^}5nj = 36,43 - 

译者注， 

I 
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外的机会大致相等. 

(b) 抽样. 设在^个家庭的总体中有个家庭恰有々个小 
孩^ — 0, .1, • • • ； 2 N k = 任选的一个家庭中的小孩 

数是一随机变量，它 以概宇 P , = NJN 取值 v. —个大小为《的 
有放回抽样的样本表示/个独立随机变量或《次“观察” &，•••， 
X„, 其中每一个都具有同一 分布； SJn 为样本平均值.大数定律 
告诉我们，对于充分大的随机样本，样本平均值多半和^ 

= ^ vNjN 很接近，后者正是总体平均值.中心极限定理可以用 
来估计偏差的槪率大小和确定为使估计可靠所必需的样本大小. 
实际上 P 和V都是未知的.然而，通常容易对/作出初步的估 
计，并且总是可以作出比较安全的估计.如 果興们 希望样本平均 
值3„/«与未知的总体平均值之间的俥差小于1/10的概率为 0.99 
或更大，则样本大小应该禆 g 条件 - . 

P { <~^}> 0-99. (1.4) 

少00 — <P(—x) = 0.99 的根为 r = 2.57 •••， 故《应当碑足 
«Vl0a->2.57 或《 > 6仙 (T 2 . 于是所需的样本大小大致可根据 
对V所作的谨慎的初步估计来确定.类似的情况、经常出现.例 
如，在实验者取《次测量的平均值时，他也信赖大数定律 5 并用样 
本平均值作为未知的理论期望值的一个估计.估计的可靠性完全 
由/ 来确定 a 而通常我们不得不使用 tr 3 的相当粗糙的估值. 

(0 普阿松分布.在第七章第4节中我们曾证明，当 ;I 很大 
时，普阿松分布 { fCk ； 能用正态分布来近似表示，这实际上 
是中心极哏定理的一个直接推论.设变量 X ,具有普阿松分布 
{ pik > r )}. 则 s n 具有均值与方差为的普阿松分布 { pik % 
» r )}. 令又=则当 » ->- oo 时辑们有 

2 t (1.5) 

其中的和是对所有小于 A 十私I的々来求的.显然，当;I按任意 
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方式趋向 0O 时， （1.5) 仍成立.这是一个具有广泛惫义的走理， 
它在发散级数的求和理论中具有应用.在估计 0.5) 两边的差时 
可以采用普通理论中的方法. 

、 」 

关于无期望值的变涯的附注 

如杲期望值 不存 在，则大数定律和中心极隈定理都没有意 
义，但可用更为一般的定理来代替它们.这些定理可提供同一类 
的讯息.在近代理论中，无期望值的变量起着重要作用，物理中的 
等待时间和循环时间就属于这种类型.甚至对于简单的掷钱币的 
游戏也是如'此. 

将” 个钱市一一投掷.设 Xf 表示对于第々个钱.币直到正面 
和 k 面的累积数目第一次达到平衡的等待吋间.则是独立同 
分布的随机 变量： 每个仅取正偶数值且 P ( X t = 2r) = f 2r3 
此处概率分布 {/aJ 按第三章 （4.2) 定义.根据第三章第4节的 
定理3,和 S„.= + • • • + X„ 的分布由下式 给出： 

P(S„ = 2r) = . (1.6) 

其中松 0 按第三章定义.在第三章第8节 （ c) 中我们曾 
证明，当《 — oo 时， • • 

P{S„ < n l x ) -> 2[1 — (1.7) 

这是一个与中心极限定 a 具有相同特征的极限定理，两者的显著 
差别是此处是变量 SW 而不是 SJn 具有极限分布. 

用物理语言来说，X;表示对同一量的独立测量，而这极限走 
理则断言，在概率意义下，平均值 s „/« 与”成 比例地增加.这个 
性质的出人意料的推论我们已在第三章中讨论 过”. 

*2 . 大数定律的证明 

我们分两步来进行.首先假定V = v ar (X ,)存在.根据第 


1) 对于不真有有限期望值的变量，与大数定律类似的定理可参看笫4节 R 问题13, 
•本节讨论专门的论题，初读时可以略去. 


• 258 • 



九章 (5.6) 中的加法规则可得 Var (S fl ) = 根据第九章中的 
切比雪夫不等式（6.1)，对于每个/ >0 5 我们有 

P {| S „-«"| (2.1) 

t 1 

令/ = 则上式左边小于或等于0- 2 /8 3 «,而当》 oo 吋， 
趋向 于零. 于是定律得证. 


其次我们放莽 Var ( X 0 存在’的限制.，这种情況可用截尾法 
化为前面所讨论的情況.这方法是一种重要的标准方法.定义两 
组依赖于的随机变量如下：、 ’ 


Ud 

= 0， 如果_ |X 々 | ^ 6»； 


»= o. 

V 々 = X 4 ，如果 |X*| >e«. 

(2.2) 

此处々= 1 ， 2， • • • ; 

”与 s 是固定的.于是恒有 



x 々 = u 々 + v 々 .. 

(2.3) 

设 {/( A )} 是变量 X* 的共同概率分布.由于我们假定了/ *== 

E(X^) 存在，故和 

S \x t \ Kxj") = A 

(2.4) 

存在 • 现在 



fi tt = 

E ( U 々>= 2] x r Kxj), 

(2.5) 

此处的和是对一切使得 k/J <8« 成立的 f 来求的. 

ffi 然当 


»-»oo 吋， ft' n fi , 故对于任意的 S > 0,当”充分大吋有 

Ia*i» — < 茂 . （ 2.6) 

又由 （2.5) 与 （2.4) 有 

Var (U^> < E(U|) < en f ^1/(^/) < ^ An , (2.7) 

是相互独立的，、且其和 Ui + U 2 + • • • + u„ 完全可用前面 
在方差有限的情况讨论 X* 的方法来 讨论; 应用切比雪夫不等.式， 


1) 原书误为 t > en ——译者注. 
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我们得到如下的类似宁 （ 2 . 1 ) 的不 等式： 

p { Ul + • • • + U "- > 4 < 如⑽ < M . (2.8) 

I n J nd 2 6 2 

由上式及 （2.6) 有 

P { U| + + U ff -^|> 2 ^} < (2.9) 

易见， V4 = 0 的概率很大.事实上 _ 

P{V^ ¥= 0} = U /( 々 X 丄 S I ^1/(^/)^ (2.10) 

l^ryf>£rt ⑶ I Xj\>en 

且 当”增 加时上$右端的和趋向于 0 . 故当》充分大吋，有 

P { V ,^ 0 }<^-, ( 2 . 11 ) 

n 

于是由第一章的基本不等式 （7.6) 有 

P { V \ + ... + V „ 关 0 } < s . ( 2 . 12 ) 

现在 s„ = (u, + ••- +u 0 ) + (v, + ••• + v B ), 故由 （2.9) 
与 （ 2 . 12 ) 有 

p ||^g > 2ff} < P | U i + ^ ^ > 2g| + 

+ P { V r + … + V „_ 0 } + (2.13) 

8 2 

因为 e 与 5 是任意的，故可使上式右边任意小，于是走理得证. 

3. “公平’’赌博理论 

为了进一步分析大数定律的含意，我们将使用由来已久的赌 
博术语，但此处的讨论同样可以应用到实用性较强的问题中去，并 
且我们的两个基本假设在统计学和物理学中的意义比它们在赌场 
中的意义更为现实.首先，我 rr 假定赌徒具有无限的赌本，因而不 
论输掉多少他仍能继续赌博.（如果没有这个假设，则要考虑赌徒 
输光的问题——概率论的研究者早就对它感到 兴釀， 在瓦尔德昀 
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序贯分析和在随机过程中这个问题是重要的，我们将在第十四章 
中讨论 .） 其次，我们假定赌徒不能随意终止赌博；试验的次数必 
须事先确定而不依赖于赌博的进程.实际上，一个拥有无限赌本 
的赌徒会等待一个好运气并在恰当的时机退出赌博.他所感兴趣 
的不是指定时刻的或然伏态，而仅仅是在长期赌博中的那些最大 
的起伏.为阐明这个问题，与其用大数定律倒不如用迭对数定律 
(参看第八章第5节) . \ 

设有一个赌徒，一直参加同一种赌博， X& 表示他在第1々次试 
验中的(正的或负的)赢利.则和 s, = x, + • • • +X 表示在《 
次独立试验中印累积 籯利. 如果对于每次试验赌徒需付人场费 
〆（不一定是正的)，则表示累积入场费，而 — 则表示 
净累积赢利.当^ = E(X^) 存在时可以应甩大数定律.粗略地 
地说 ，当” 很大时，差 S„ —即 多半要比》小的多，故如果人场费 
〆小于则当《很大时，赌徒的净赢利多半是正的且其大小的 
阶为—〆) . 根据同样的理由，如果 〆 > 尸 ,则赌徒会要吃 
亏.简言之 ，/ < ^ 的情况对赌徒有利，〆 >开的情况对赌徒 
不利. 

注意,以上的讨论并未涉及的 情况. 在这种情况，仅 
能作出如下的论断：当《充分大时，累积赢利或损失 s n —的 
绝对值 u 比”要小得多的概率接近于 1 . 但并未说 s n _ 是多 
半为正还是多半为负，亦即是对赌徒有利还是不利.在古典理论 
中称〆为“公平”价格，并称〆=〆的赌博为“公平”赌博， 
是考虑不周密的.-这个不正确的名称造成了很多危害.必彡页指 
出，所谓“公平”赌博，既可能对赌徒有利也可能对赌徒不利. 

显然，在 4 ‘正常”情况下， E(x*) 与 Var (X ,)都存在.对于 
这种情况，大数定律可由中心极限定理加以补充，后者告诉我们， 
对于“公平”赌博，净累积贏利 S„ —的大小大致与^同阶， 
且当”很大时，净贏利为正或为负的可能性差不多相等.故当可 


1) 原文无■•绝对值”三字,似不妥一一译者注. ^ - 
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以应用中心极限定理吋，“公平”这一术语是合 理的， 彳旦甚至在这种 
情况，我们仍然是与涉及长时间过程的极限定理打交道. 

例如，设某赌徒参 加一种 赌博.他每次以 1<T 6 的概率净赢 
10 6 -1元，而以1 一 10 - 6 的概率损失〆=1 .( 元)时入场费.可以 
把这种赌博看成是伯努利试验，易知这是一种“公平”赌博.在一 
百万次试验中赌徒需付一百万元的入场费.他可能赢0, 1, 2,… 
次.由二项分布的普阿松近似公式知，贏 t 次的概率为^ 1 /々!(精 
确到好几位小数).于是赌徒损失一百万元的概率为 0.3 仙…，仅 
能收回所花人场费的概率也是 0.368 …， 净赢一百万元的概率则 
为 0.184 …，等等.此处的10 6 次试验等价于赢利按普阿松分布的 
赌博中的一个单独试验(这可通过两付牌的配对问题来 理解; 参见 
第四章第4节).显然在这种情形大数定律不具有操作上 
tionally) 的意义.现在所有火灾、车祸及其它类似项目的保险，都 
属于上述这种 类型； 当被保险的意外事件发生时公司要支付巨额 
的赔偿费,但相应的概率非常小.此外，被保险户通常每年仅参与 
—次试验，故试验次数《决不会变得很大 3 对于他来说赌博必然是 
“不公平”的，但它通常在经济上有 好处； 大数定律与他毫无关系. 
对于保险公司来说，它进行赌博的次数则很多，徂由于方差很大， 
故随机起伏是必然保险费必须定得使任一年中的巨大损失能 
得以消除.故与公兩有关的与其说是大数定律倒不如说是输光问 
题. 

如果方差无限，则“公平”赌博这一术语完全是一种 误称; 并没 
有什 么理由可以认为净累积赢利 S „ - 的起伏是围鐃零的. 

事实上，存在“公平”赌博的例子吒在其中赌徒不断吃亏的概率趋 
向于 1 . 大数定律仅断言，赌徒净损失的大小大概具有比《更小 
的阶.然而，并不能作出进一步的论断.设^ ■是满 足条件— 
0 的任意序列，则可以构造一种“公平”赌博，使得赌徒在第《次试 
验时净累积损失超过 〜 的概率趋向于 1. 在问题15中，实际上可' 
以确信 3 赌徒的损失将超过 «/log «. 这个赌博是“公平”的，且入 
场费为 1. 很难想像，一个赌徒，在他遭受的损失实际上必然是稳 
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定地上升的情况下，会认为赌博是“公平”的, 


i 


M . 彼得堡赌博 1 

在古典理论中，期望值的概念并未明显地从概率的定义中分 
离出来，也没有建立论述这个概念的数学形式体系.因此，具有无 
限期望值的随杌变量就引起了不可克服的困难，甚 室近代 概率的 
研究者在最近的讨论中对它都感到生疏.具有无限期望值的随机 
变量的重要性，我们已在笫 1 节末强调过，本节我们将给出关于这 
种变量的一个与大数定律相类似的例子.为此我们使用历史上著 
名的所谓彼得堡 （ Petersburg ) 谇论' 

彼得堡赌博中的单独试验是投掷一枚钱市直到出现正面为 
止; 如果正面在第，次投掷时出现，则贿徒赢得: r 元.换句话说， 
每次试验中的赢利是分别以概率 2\ 2 V - 
的随机变量.期望值形式地由 -£ xJU ) 来定义，此处 A = 2 % 
Kx r ) = 2~\ 故这个级数中的每一项均为 1 . 于是赢利不具有有 
限的期望值，所以不能应用大数定律.现在我们修改赌博规则如 
下： 如果试验需要投掷 W 次以上（即接连出现 W 次反面)，则赌徒 
的赢利为 0 . 修改后的赌博不及修改前那样对赌徒有利.在新赌 
博中，贏利具有有限的期望值，且可以应用大数定律.由此可得， 
对于每个 iV ， 在”次 试验后累积赢利多半要超过 W AT . 因此不论 
赌徒对每次试验需付的固定入场费 k 是多少，他总能指望赢得净 
利' 对于每个 〆 都是如此 3 但为了有希望得到正的贏利， 〆 越 
大时” 也必须越大.古典理论断定 ，〆 ==是“公平”的人场费， 
但近代的研究者简真不明白这个 “ i 孛论”构这种神秘的讨— - . 


* 标有星号的节讨论专门的问题，初读时可以略去. 

1) 这个浮论曾由 D . 贝努利讨论过 • 注意：贝努利试验是由于 J . 贝努利而命名 

的. 

2) 这里的赌博是指彼得堡赌博.为了理解此处的论断，对于任意固定的 〆 取 A /> 
〆 ，并设想赌博按上述规定修改，于是可应用大数定律——译者注. 
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确定人场费使得彼得堡赌博具有古與意义下的“公平 b 赌博的 
所有性质是完全可能的，只是这吋人场费不是常数而是依赖于试 
验的次数.在赌场中并不会遇到可变入场费的情况，在那里由$ 
资本有限，彼得堡赌博也是不可能的.在期望值 P = E ( X ^) > 0 
为有限的情况 3 如果当《很大时累积赢利 S „ 与累积入场费^ 
« 〆 之比大致接近于1 (即差 S „ 的阶大致要比〜的 

阶更小)，碑称赌博是“公平”的.如果 E ( X <) 不存在，则我们 
不能令〜而必须用其它的方法来确定〜.如果对于每个 
s > 0 

p II A. _ 1 > gj _»0, (4.1) 

妯我们称累积入场费为〜的赌博是在古典意义下的公平赌博. 
(4.1) 式与大数定律完全类似，对于后者大数定津被物 
理学家解释为《次独立测量的平均值必定接近于&在现在的场 
合” 次测量的平均值必定接近于 ejn . 极限定理（4.1)，当它成 
立时，具有与大数定律相同的、数学和实用上的意义. 

现在我们将证明 1 >，如果令 ^ n ==« hgn , 则彼得堡赌博成为古 
典意义下的“公平”赌博，其中 logn 是以2为底的对数 ，即 2'^ = 

、 证.我们用第2 节中的截尾法，此吋变量与 V^k = 1, 
2 ，••*，》)按下式定义： 

= X 4 , = o 3 如果 XjSwlog ”； 

(4.2) 

U 々= 0， = X ^, 如果 X 4 > nlog ”. 

又有 = u , + a iv 相互独立.对于每个，我们有 
P { X ^ > t } < lit , 故有 ' P { V ^ ~ 0} < 2 /(n Iog »)， 或 

PtVj + Vj -(- • • • + V n > 0) < -- >0. (4.3) 

log n 

•为证明 （4.1) 只需证明 ' 

1) 这是广义大数定律的 一个特 洙情况 ，根据这 个定律 易导出 (4.1) 成立的 充分必 
要条件;参见 [4], 
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P {i Ui + • • • + U„ — n log n| > e« log n] —*■ 0. (4.4). 

令 fin = cri = Var (U^)； 这些量依赖于《，但对 U:， 

U„ •, U„ 来说是共同的 .设” 是满足不等式 log « 的 
最大整数，则〜 = »• 且对于充分大 的”有 

log ft < fin dog n + log log «. (4.5) 

类似有 ' 

a\C E(UO = 2 + • 2 3 4 - ■•- + 2 r < 2 出 < 2»log«. (4.6) 

因为和 U+ •… +U „ 的均值与方差分别为与 
故由切比雪夫不等式有 

P{|Ui + ••- + U„ — > e«/4„} 

- (4.7) 

e J log n 

由 （4.5) 知户 log »，故 （4.7) 等价 f (4.4). 

5. 分布不同的变量 

直到现在为止我们仅考虑了变量具有相同分布的情况. 

这种情况对应于同一随机游戏的重复.现在我们来考虑游戏的类 
型在每一步都发生变化吋将会出现什么情況.这个问题更有趣 
味.没有必要使用赌博的 语言； 一个统计学家在应用统计检验时 
就会遇到这类随机变量的分布随着情况的不同而变化的问题. 

为确定起见，我们设想对于所给概率分布的无穷序列和每个 
»，总存在》个具有指定分布的相互独立的随机变量.我们假定. 
均值与方差存在并令 

fi k = E(X^i s <r(='Var (X*) v (5.1) 

和 S a = Xi + • • • + 也具有有限的均值与方差 

m n == E(S„), s 2 „ = Var<S fl ), (5.2) 

且 

-f- • * * + fin) = O'? + * • • + <T« (5.3) 

[参见第九章公式（ 2 . 4 )与（5.纟）].在同分布的特殊情况我们有」 
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m n = nfi, = «cr 2 . 

如果对亍每个 S > 0 有 

P ^ > s } — 0, (5.4) 

则称对于序列 { X 4 } (弱)大数定律成立. w ~ 

如果对于每个固定的《 < /?有 

F ~ 4 一 0⑻一 <?(«), (5.5) 

则称序列 { XJ 服从中心极限定理 .' 

概率论的一个突出的特 k 是大数定律和中心极限定理对十分 
广泛的一类序列 { XJ 成立.特别，当 X & —致有界，亦即当存在 
常数 Z 使得 IX 」< j 对一切々成立时，大数定律成立.更一般 
的说，大数定律成立的一个充分条件是 

-^-^0. (5.6) 

n 

这是切比雪夫不等式的直接推论，并可用第2节第一段中的方法 
来证明.注意，条件 （5.6) 并不是必要的（参见问题 14).. 

关于中心极限定理曾经得到过各种各样的充分条件，但这些 
条件都被麟德堡 13 定理所代替，按照这个定理，中心极限定理成立 
的一个充分条件是，对于每个 e > G 截尾变量满足条件 
00及 

-^ SeCUO - I , (5.7) 

. d *=i 

其中 U 4 按下式 定义： 5 

U * = X * — 如果 | X * — ^ es ny 

(5.8) 

= 0, 如果 | X * — 和 I > e / n . 

如果—致有界，即，如果则当《充分大使得 
〜 > 2 如- 1 时， U , = X 4 - 于是 (5.7) 的左边等于 1. 故由 

1) J. W. Lindcberg, 见参考文献 [2]. 
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麟德堡定理可以推出，每个一致有界的相互独立的随机变量序列 
{ X k } 都服从中心极限定理（当然，还需假定 — 00 ). 可以证明， 
麟德堡条件也是 C 5.5) 成立的必要 条件汽 证明将在第二卷中给 
出，在那里我们还将估计 (5.5) 两边的差. 

我们曾指出，在变量具有相同分布的情况中心极哏定理 
比大数定律强.在一般情况并不是这样，我们也将’看到，中心极限 
定理可适用于并不服从大数定律的序列. 

例 .（ 0 设 A > 0 为常数，令\ = 土 V ,其中每个值具有 
槪率 1 / 2 ( 例如，掷一个钱币，第々次投掷的赌注为 ± f >. 此处 
^ = 0 , < s \ = 且 2> .. 

„ 2i+l 

si = 1 3A 4- 2 n + + • • • + 〜- . (5-9〉 

2 又十 I 

如果 ； l < 丄，则条件 （5. 6 ) 满足.^当时大数定律成 
2 2 

立; 我们接着证明当时大数定律不再成立. ： 

2 

当々=1 ，2， …，” 时我们有 |XJ =* < n x , 故当 a >• 

(2 又+ l ) e - 1 2 时截尾变量 Ut 与 X * 恒等 j 于是当又 > 0时麟德 
堡条件满足，故有 - 

P {« < S 9 <^} 一卿) 一 <P(«). (5.10) 

由 此可得 s „ 大概与同阶，故当 A > 4 •时大数定律不成立. 

Jit 

在这个例子中我们看到，对于所有的 A > 0 中心极限定理成立，而 

仅当 A < 士时大数定律才 成立. 

2 

Cb ) 考虑由各自投掷钱市 1000 次所构成的两个独立序列，我 


1) 见[20〗.在这篇文献中还导出了对于无期望值的变量也适用的广义中心极1!艮 

定理.注意，此处我们仅考虑独立变量；对于相依变置麟德堡条件既不必要也 
不充分. v 

2) 根据 Stolz 定理；参见 ^ HXTeHTO ^ bU , 微积分学教程，一卷一分册， P . 59- 

译者注. 
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们来考察出现正面的次数之差 D / 将这两个序列中的各次投掷依 
次从1到1000及从10叮到2000加以编号，并定义 2 GOO 个随机 
变量\ 如下： 如果第 i 次投掷时出现反面，则令 X t = 0 •，如 
果出正面，则当 \ < 1000时令= 1而当^> 1000时令 
X 々 = — 1,则 D = X 1 + X 2 + • • • + X _. 且当々 < 1000 

时户々=丄，当々 > 1000 时〜 =一 — ； cr \ = ~3 »* 2ooo — 0, 
2 2 4 

do ® = 500. 所以 D 在 范围土 （500)1 a 之内的概率近似地等于 
中(《) — ( P (- a ) 3 且和在2000次投掷中正面出现次数与其期望值 
1000 之间的偏差 S 2 aoo — 1000 是同等级的. 

(0 _下面我们给出中心极限定理在遗传理论中的一个应用， 
以显示中心极限定_推论的广泛性.在第五章第5节中我们曾 
研究过本质上仅依赖于一对基因(純粹单位形质)的性状.其它一 
些性状(例如体长)，可以设想为很多基因对的累积效果.为简单 
起见，假定对于每对特定的基因存在三种遗传型2^，或 aa . 
设它们对体长的相应贡献为 A ， 々与〜一个个体的基因型是 
一个随机事件^ 一对特定的基因对体长昀贡献则是以一定的概率 
取值 A ， A 的一个随机变量.体长是很多这样的随机变量 
X ,, X ,, • ••, x a 的积累效果.由于每一贡献皆甚微小，我们可以 
粗略假定体长为和数并不是所有的 x 4 ' 都是相互独 
立的.然而，中心极限定理对于很大一类相依随机变量也成立，而 
且也有一定的理由把 X & 中的大多数当作独立随机变量来看待. 
这些考虑可以进一步精确化 s 此处它们仅用来说明怎样用中心极 
限定理来解释为什么很多生物统计性状的绎验分布与正态分布垠 
接近.这种理论也可以对遗传性状，例如子女的平均身长对其双 
亲的体长的依赖性，作出预测.这种生物统计的研究姶于格尔顿 
( F . 0也011)\与皮尔逊 （ K . Pearson ), 
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6. 在组合分析中的应用 


本节中，我们将给出中心极限定 理在与 概率论并无直接关系 
的问题中的两个应用.两者都 与《个元素 fli ， 心， ” •，〜 的》! 
种排列 有关， 对于毎个这样排列我们都赋 与概率 !/«!. 

(a) 逆序. ： 在一个给定的排列中，我们称元素~产生^个 
逆序，如果 恰有* •个足标比它小的元素(即按自然顺序在4之前 
的 兀素)在它之后.例如，在 中， 兀素与 h 不 
产生逆序， h 产生两个逆序，〜不产生逆序， A 产生两个逆序, 
fls 产生四个逆序.在 （ flWshflsflaai ) 中，元素 A 产生 々一 1个逆 
序，逆序的总数为 15. 々所产生的逆序数是一随机变量，而 
S fl = X , + • • • + X „ 则是逆序的总数.这里\取值0, 1，-…， 
々一 1的概率都是1所以 • * 

^ ~ 、 〔6.1〉 

•At 

1 + y+ … + ( 々一 1) 2 _ = U 

k k \ 2 ) 12 * 


所产生的逆序的数目并不依赖于•••，的相对次 
穿，且\是相互独立的.•由（ 6 .1)我们得到 . 一 

一 1 -f~ 2 -f- * * * ~f~ (jt 1 ~ 1) — n(j2 — 1) 


2 


4 


4 


及 


si 


± y ( i »- d = 2ni + 
i 2 ^ y 72 


«， 


(6.2)、 


(6.3) 


当 ® 很大时我们有 es „> n > | X ^— , 故麟德堡条件中的变 

量与 X t — 尖恒等 .. 于是中心极限定理成立，由此我们得到 

如下 结论： 其逆序数在范围！ 2 ±土^之内的排列的数目渐近 

4 6 


本节讨论特殊的论题，可以略去. 
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地由 «!{< P («)-(?(-«)} 给出.特别，在所有的排列中大约有 
—半其逆序的数目在范围 （《VO 土 （0.11) j 之内. 

( b ) 循环. 每个排列都可以分解为若干个循环，所谓循环是 
指在其内部进行排列的一组元素 1 \例如，在中，我 
们看到 ，〜与 a 3 互相交换，剩下的四个元素则在其内部进行排 
列•，故这个排列包含两个循环.如果一元素排在它的自然位置，则 
它构辑一个循环，故按自然顺序的排列 （ fli ，• • •， a n ) 包含 n 
个循环.另一方面，形如 ' ( fla ， A ，• • •，〜）， （ A ， A ， …， Cn ， 
« 2 ) 的循环排列都只包含一个循环.为了研究循环，用标志元 
素所占据的位置的箭头来表示排列是方'便的.例如，1 —3 — 

4 — 1表示 fll 在第三个位置， a , 在第四个位置， q 在第一个位 
置，这个循环在第三步完成.继续用这种方法来表示包含 Q 的循 
环，此处〜是按自然顺序的第二个元素.按照这种记号，排列 
( a 4 ， fl 8 , a !， a 3 , fl 2 , fl 5 ， a 7 ， <? 6 ),可以表示为： l -*3 - 
5 - *6 - >8 ― »"2;7-»7. - 

如果在此种结构中第丨步完成一个循环，则令 X 4 = I;否则 
令 X 4 = 0 . (在最后的一个例子中， "X 3 = X 7 = X g = 1 , X, = 
X 2 =X, = X 5 =X 6 = o.) 显然，当且仅当 fli 在第一个位置时， 
x：= 1. 在笫1，2, …， A 步，我们分别 有”， n - 1 , •••, 0 
种选择方法，在其中恰有一种方法导致一个循坏的完成.所以 2) 
= 1的概率为 1/(” 一 々+ 1)， X 4 = 0的概率为 （》— 々)/ 一 
(« —々+ 1).变量 Xt 是相互独立的，其均值与方差为~ 

--1——， c \ -—， (€.4) 

n — 々 -f- 1 (n — 次 + 1 〉 a 

由此 ’ 


1 ) 此处的叙述过于简略，今补充 如下： 在一个排列中，设力，排在第个位置, 

排在第；3个位置 ，…， «(*_, 排在第 《_* 个位置 ，而％ 则排在第6个 

位置，则称这4个元素构成一个循环.有关的讨论可参看张禾瑞，《近世代数基 
础 》, pp. 54-57 一译者注 . 』 

2) 形式上， X * 的分布不仅依赖于々而且也依赖于》.按从々=»开姶到々=1 
为止的次序将 X * 重新编号，就可使得分布仅依赖于足标. 
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ttt n ■** 1 ~f~ — + — -f- , • • + - 〜 log 0 ， 

2 3 n 


且 






k 


*=1 (« — 々 + l) 2 


logf*. 


(6.5) 


(6-6) 


s „ = x —斗 x „ 是循环的总数.其平均值为 《»«•， 循环数在 
log /J + oe( log 与 log « + (!?( log »)* 之间的排列数断近地由 


«! md ) - <?(«>} 给出.改进后的中心极限定理给出的估计更为 

精确、 


*7. 强大数 定律 


(弱)大数定律 （5.4) 断言，对于各个充分大的》偏差 |S„- 
f» B | 大致上要 比”小 得多.关于伯努利试验(第八章)，我们曾指 
出，由大数定律并不能得出对于所有充分 大的〜 |S„ _ m„|/ n 始 
终很小的 结论; 可能遇到这种 情况： 大数定律成立而 
—直在有限或无限的范围内摆动.由大数定律仅能得出这样的结 一 

论： |S„ _ A* 取大的值的情况是很少出现的. 

我们说序列 X& 服从强大数定律，如果对于每个 e > 0与5 > 

0,有 W 与之对应，使得对于每个 r > 0所有 r 个不等式 

1 S " • 一 丨 < s， n = N, N + 1 3 •• •, N + r (7.1) 

n 

同时成立的概率不小于1 — S . 

(7.1) 可以粗略地解释 如下： 对于所有的 《>iV, 1S„— 

姶终很小 2) 的概率占压倒的优势. 


1) 组合分析中的一大批渐近估计是用其它方法导出的，见 [6]. 现在的方法较简 
单，但应用的范围较小，参看 [7]. • 

•本节 讨论专门论題，可以略去. 

2) 在一般理论中引入对应于无穷序列{ X *}的样本空间.于是强大数定律可陈述 
为： 1 S •-趋向于0的概率为 1. 用实变函数的术语来说》强大数定律 
所作出的论断是几乎处处收敛,而弱大数定律则等价于按测度收敛 
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柯尔奠果洛夫准则.级数 



(7.2) 


收敛是方差为4的相互独立的随机变量X;的序列服从强大数金 

肆的一 个充分条件. ' 

证明.设尤表示如下 事件： 至少存在一个满足关系式2- 1 < 

的〜使得不等式（ 7 .1)不成立.显然，只需泜明对于所有 

充分大的> log IV)及一切 r 有 

P{A V } + P{^»+i} ■+•••+ P{A V+ ,} < 5 , 

亦即级数 SP{jJ 收敛.易知，事件蕴含如下 事件： 対某个 

满足关系式 2W <• » < 2- 的《有 
• ' 

|Sa 一 m n | ^ — * 2 V S 
2 

由柯尔莫果洛夫不等式(第九章第7节)得 
- P{A„] < 4s~ 2 sU - l~ lv . 

故有 

• > j v 

2 PU) < 4e-> S 2- 3y S <r\ 

V »I • V=1 弋 =1 


(7.3) 

(7.4) 



■ 4e _J 2 S 《 8s~ J 2 

*=i *=i ^ 

于是定理得证. 


(7.5) 


作为一个典型的应用我们证明如下的 
定理.如果相互独立的随机变量序列 X & 具有共同的分布 
{/(^)}且 p = E(X,) 存在，则序列 {XJ 服从强大数定律. 

这个定理显然比第1节中的弱大数定律强.由于证明在方法 
论上的重要性，我们对这两个定理独立地进行讨论.本定理的逆 


定理可参见问题 I 7 . 

证.我们再次应用截尾法.引进两个新的随机变量序列 如下： 
U , = v , = 0, 如果 |XJ <々， , 

U 々 = 0， 如果 | X 4 | > （7,6) 
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Ua 是相互独立的，且我们 贤证明 它们满足柯尔莫果洛夫准则.显 

E(UD = 2 x)K Xi ). (7.7) 

I af J I 

然，作为简写，令 

«„ = S I Xj I /(s ： j>. (7-8) 


因为 E ( XO 存在，故级数收敛.此外，由 （7.7) 有 


^ <*i + 2a 2 + 3« 3 + ." * * + K a k 


(7.9) 


及 




2>,2 士 

v«l. 走 *»V K v al 


最后， 


ECU ^) = fi K <=■ 2 x if ( r i )， 


(7.10) 

(7.11) 


故化 -»• 芦且（的 + 内 + … ■ + /«»)/» — p •对 { U *} 应用强大 
数定律，我们得到如下 结论： 不等式 
,” 

»-* Su 々一〜< e (7.12) 

1 C = l 

对一 W n N 成立的概率不小于1 — S . 现在只需证明， V „ 可 
略去不计， PP 当 N — CO 吋有一个或一个以上的 V „0 t 〉 N ) 异于 
零的概率趋向于 0. 易知，这等价于有无穷多 个”使 得乂„ 的 

概率为0»，于是由波雷尔-康特立第一引理(第八章第3节)知^为 
此只需证明 SP { V „ ， 0} 收敛.我们有 . 

^ P { V , V 0} = 2 / Oy ) 

\x^\>n 

^ 十 a n_+2_ _j_ g «+3_ ••• (7.13) 

货 n ~h 1 w + 2 


l ) 这句话是译者加的——译者注 • 
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于是 


SP { V „^ o }< i ] S 

n = l per ? ^ 

= 2 2 1 = S °»+i < 00 > ( 7 - 14 ) 

v S 1 ^ AS 1 V 

证毕. " 

， ' 8 .问 题 

1. 证明在例 （5. a ) 中当； I 矣0时大数定律也成立 • 当;1>一"|■时中 

心极限定理成立 . ~ * 

2. 试判定对于下列相.互独立的随机变4的序列 Xi 大数定律与中心极 
限定理是否成立，其中 X * 的分布定义 如下： 

( a ) P { X * = ± 2*> = i -； i 

(b ) P { X * = 土 2*} * 2 - (lk+,) t P{X k = 0} = 1 - 2' 1 *； 

( c ) P { X * = 土 + k - l/t , P{^k = 0} = 1 - 

2 - 

\ 

3 . 李雅普诺夫条件 （1 9 01). 设对于某个固定的 « > 0我们有 
E (| X A p +*) = A *. 其中心 AJ < 常数. 试证明当〜 — oo 时麟徳堡条件成 

立. 

4. 设 { sr *> 是相互独立的随机变量序列 3 其中 X * 取每个值 

士 ± 2^^*" 9 ± 2 tVt l ** 

的概率都是 1/(2^ + X ).试求加垚 {&} 上的、使 { X »}_ 满足弱大数定律及 
(或）中心极限定理的充分条件 • 

5. 设 X * 取值— 与0的概率分别为 P *, #>* 与1~冰，试讨论同 
样妁问题. 

注意： 以下七个问题讨论相依变量的弱大数定律 • • 

6. 在第五章问題 I 3 中，如果第/：_次投掷出现红面则令 X * = 否则 
令 X* = 0. 证明大数定律不成立. 
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7 . 设 {X*} 栢互独立且具有有限的均值 P 和有限的方差.试证明对于 
序列 {S ,} 大数定律不成立，而当0时，对于大数定律成立. 

8. 设 { X*> 为一随机变量序列，其中 X* 可以依赖于 X*_ ，与 X* +l 而不 
依赖于所有其它的X;.试证明，如果 X* 具有界的方差，则大数定律成立. 

9. 如果对于每个规定了（ X ,, •••, X») 的联合分布，使得方差有界 
且所有的协方差为负，则大数定律成立. 

10. (续上).用当丨丨一々1—00.时 C OV (X;,X*)-*0 —致地成立的 
假定来代替 Cm (X # , X*) < 0的 条件. 证明大数定律成立. 

11. 如果！ S,| 且 Var (S,) >«»S 贝树于 {X*} 大数定律不成 

立 . . ' 

12. 在波利亚罐子模型中[第五章 （2.C)] 如果笫々次抽得黑球则令 X* 
等于1,如果抽得红球则令 X* 等于0.则 扎为 .》 次抽取中抽得黑球的总 
数.证明对于大数定律不成立* (提 示： 利用问题11及第九章问题 
30). 


13.设{X*}是相互独立的随机变量序列，其中 X* 取值” = 2,3,4, 
• • • 的概率为= c /(r* loc - r ) , 此处 e 是使得 = 1 的常数 * 试证味如 
果令 e m => e • ti log log ”， 则广义大数定律成立. 

H . 设{ X,}是相互独立的随机变量序列，其中 X» = ± 1的概率均为 
(1 - 2-*)/2, X, = ±2* 的概率均为 2 -«-\ 证明对于{X,}弱大数定律与 
强大数定律都成立•（注：这证明条件 （5. 6 )不是必要的) • 

15. 不利干睹徒的“公平”賭博的例子.设在每次试验中贏利的可能值 
为0, 2, 2% 2%…；贏利为 2* 的槪率为 


Pk 


1 

2 k kik + 1 )* 


( 8 . 1 ) 


而嬴利为0的概率为 #>o = l - ( P , + P , + 赢利的期望值为 

M = $ 2 * 户* = C 一士 ) + (+ — +) + (+ + …= 1 . ( 8 . 2 ) 

设对于每次试验赌徒需付的人场费为 h 于 是在” 饵试验后他的净赢利(或 
损失)为 s »_ 〜试证明，对 f 毎个 8 >0,在”次试验中赌徒遭受的损失 
超过 （I — e ) n / Jos , n 的通率趋向于1，此处 】 og2 »表示以 2 为底的对数 • 
即要证明 • 
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p{s,- g < (8.3) 

提示： 利用第 .4 节中的截尾法，但用 »/Io gl «来代替 （4.2) 中的界限 
证明 u*=x * 对所有的々< n 成立的概率趋向于1,并证明 

P -| | U, + • • • + U, - nE(U,)| < — — J- —*• 1 . (8.4) 

1 一 -p^— > EdJ,) > 1 — (8.5) 
log, n Jog 2 n 

详见 [3]. ' ' . ' 

】6 •设 { X,> 是独立同分布的随机变量序列.设 X n 不具有有限的期望 
埴，并令 d 为正常数.试证明在事件 |X,i > An 中有无限多个出现的概率 
为 1. 

17. 强大数定律之逆.在问题16的假定下， |S,| > A 对于无穷多个 

»成立的槪率为 1. ' 

18. 柯尔莫果洛夫准则之逆.如果发散，则存在方差为 

Var {X*> = ff* 的相互独立的随机变貴的序列 {X*>, 使得对于这个序列强 
大数定律不成立.（提 示： 首先证明级数 £P{tX,| > e „> 收敛是强大数定 
律成立的必要条件). " 
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第十一章取整数值的变量 • 母函数 

- 1.槪论 

在离散随机变量中仅取整数值0, 1, 2 , ... 的变量特别 
重要.它们的研究被母函数的方法所促进，我们将看到，这种方 
法是特征函数方法的一个特殊情况,后者在概率论中起着重要作 
用.更一般地说，母函数的理论属于在微分方程与积分方程中有 
着广泛应用的运算方法的领域.自从拉普拉斯与德模佛以来，母 
函数就已在概率论中得到应用，但这种方法的效能与潜力却很少 
被充分 利用. 

定义 .设 a 。， a 2 , • * • 是实数的一个序列.如果 

AO) = a 0 + + + … ( 1 . 1 ) 

在某个区间中收敛，则称 JO ) 为序列{力}的母 
函数. - 

变数 < 本身并无意义.如果序列有界，则逋过和几何级 
数相比较可知， （1.1) 至少当 J < 1时收敛. 

例.如果对于所有的/，心= 1 ， 侧 2(0 = 1/(1 — 0. 序列 
(0, 0, 1，1, 1，…）的母函数为 5 S /(1 - S). 序列~ = 1//!具有 

母函数 < 对于固定的 B ， 序列 (") 具有母函数 （1+0' 

设 X 是掷一个均匀的骰子时出现的点数，则 X 的概率分布具有 
母函数（，+ P + / + / + / + r®)/6. 

设 X 为取值0,1, 2 , ••• 的一个随机变量，为方便起见，我 
们引入记号来表示 X 的分布及其尾部： 

P{X = ;'} = Pi ， P{X >/}=%.. (1-2) 

于是 
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= Pk+i + Pk+i +...，_ (1-3) 

序列 {巧} 与的母函数为 

P(j) = Po + Pis + pjs 2 + p 3 s^ + • • •, ( 1 . 4 ) 

QO) = ^0 + + qiS 2 + + * * ( 1 . 5 ) 

由于 p ( i ) = i a 故 p (0 的级数至少在区间一 l < < < l 中绝对 
收敛. 5(0 的系数小于1，故 2 G ) 的级数至少在开区间一1 < f 
< 1中绝对收敛 .. 

定理 1. 当一 l < f < l 时我们有 

g 0) = 0.6) 

1 — 5 

证. （1 — f ) . 中、"的系数当 n > 1时为— q n -x =* 

一 p«3 当 ” = 0时为 qo — pi + pi + ■ • • = 1 - to. 故 （1 — ,) •- 
QO ') = 1 — Pis '), 证毕. 

下面我们来研究导数 

P ' 0 ~) = 2 j kPk sK ~ l - (1-7) 

1 

这个级数至少当一 1 1时收敛.当 f = 1时右边形式上 

化为 - LKPk - ECX ,). 如果这个期望值存在，则导数， 0) 在闭 
区间一 1 < S < 1上连续.如果 ^ KPk 发散，则当1时 
P ' G ) — TO . 在这种情况，我们说 X 具有无限的期望值并记为 
PXl ) == ECX ) = 00 . (因为所有的量都是正的，故我们可以放心 
地使用符号 oo .) 对 （1.6) 的右边应用中值定理可得; 20) = P ' o )， 
其中 a 是 f 与1之间的一个点.当< — 1时函数 Qoy 单调地增 
加，故 2(:) — E ( X )( 有限或无限).这就证明了如下的 
定理 2. 对于 E ( X ) 我们有两种表示法， 

E ( X ) = iPi = S (1-8) 

、 i = 1 *s=0 . 

用母函数来表示，则为 

E ( X ) = P '(1)= P (1). Cl . 9) 

微分 （1.7) 及关系式 = —(1 根据同 
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样的方法我们得到 ^ 

E(X(X — 1)) = 一 1)外= P"(i) = 2 QXiy \ (1.10) 
加上 E(x) — E 2 (X)， 我们得到X的方差，于是有如下的 

定理 3. 我们有 

Var (X) =，，(1) + PTl) - P ，2 (l) 

= 20 ， (O + (?0)~ QKl\ (1.11) 
如果方差无限，从当1时 P f XO -> 0O. 

公式 （1.9) 与 （1.11) 经常提供计算 E(x) 与 Var (X)的最 
简单的方法. 


2.褶 积 

设 X 与 Y 是两个取非负整数值的独立随机变量，其概率分 
布分别为 P{X = ；'} = fly, P{Y = ；'} = bj . 事件 (X == j,Y = 

的概率为 咖. 和 S = X + Y 是一新随机变量，事件 S = r 是 
下列互不相容的事件 之并： 

(X - 0, Y = r ), ( X = I , Y = r - 1), 

(X = 2， Y = r — 2), . _ •， （X = Y = 0). 

故分布 = P(S = >•) 由下式给出： 

c , = aj} t 4 - d x b r ^ + a 2 b r ~i 4- — + a r - ib x +■ a r b 0 . (2.1) 
由两个序列 { h } 与得出一个新序列的运算 （2.1) 
经常出现，为方便起见，我们给它起一个名称并引进一种记号. 

定义 .设与 {&} 是任意两个数列(不必为槪率分布）. 
由（ 2 _1)所定义的新序列 { d 称为{々}与 {&} 的褶积 2) ，并记 
之为 

{^ 1 ^} ~ {<?々}*{々々}• (2.2) 
例 .（ a ) 如果对于所有的々 > =心=1，则 4 =々 +1. 


1) 原书误为 20(1) ——译者注. 

2) 有些作者喜欢用德文 faltung 表示褶积（英文为_ Convolution —— 译者注） . ， 
与之等价的法文名词为 Composition . 
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如果 fl* = k> h = 1，则 c k = I + 2 + ••- +々 = 々(々 + 1)/2. 
最后，如果 «o = «i = 1/2,当爻 > 2时〜 一 0，则 《： t = + 

〜-1)/2，等等. 

序列 { aj 与 {&} 的母函数为 Z ( s ) = Sa〆 与 BO )= S ^ t ^. 
乘积 ^0) BO ) 可由 ^0) 与 BO ) 的幂级数逐项相乘而得.合 
并 < 的幂次相同的各项，我们发现在 ^0) BO ) 的展开式中^的 
系数^由 （2.1) 给出.于是我们有如下的 

定理. 设»与 { M 是两个序列，其母函数为 4(0 与 
S (0, 褶积为{^},则母函数 C (0 = 是如下的乘积： 

CO) = A(s)B(s\ (2.3) 

如果 X 与 Y 是取非负整数值的两个相互独立的随机变量，其母 
函数 15 为 dCO 与 B 0), 则它们的和 X 十 Y 的母函数为 Ads ') 
5(0. 

现在设 { a k } 3 { b ,}, { c ,} 3 {<}，•••是任意的序列.我们首 
先作出褶积{«,}*{^},然后作出这个新序列与 { Cj J 的褶积，余 
此类推.的母函数为 ^0) £(0 C 0) 
D 0 X 这表明构成褶积的次序是无关紧要的.例如， U k }* 
{^} * { 4 } = { q } * {&} * {« J , 等等.于是摺积是一种可结合 
和可交换的运算(与随机变量的求和完全一样). 

在研究独立随机变量 x „ 的和时， x „ 具有相同分布的特殊情 
况特别重要.如果 {«,} 是 x „ 的共同概率分布，则我们用 {«,}"* 
表示 s „ = X , + + X „ 的分布.贝 ij 

= {«/} * {«/}j {<>iY* = {«/}>••• (2.4) 

—般地 

{〜}”* = {〜}(»-_*{〜}. (2.5) 

用话来说，（七}4是其母函数为的一个数列.特别 ，沁 : r 
与 k } 是同一序列，{^} 0+ 则定义为其母函数为 AKs ') = 1的序 
列，即序列（1，0, 0 3 0, …）. 

1) 取非负整数值的随机变量的母 函数是 指其分布的母函数，即垵 （1.4) 来确定， 
原书未明确给出这一定义译者注， 
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例 .（ b ) 二项分布. 二项分布 Kki P > = (^) 的 

母函数为 

2 ( A ) (芦)々 =*=(<? + P 0 a . (2-6) 

以上母函数是 g + / v 的《次方这一事实表明， { K 々； 》， /»)} 是 
个独立随机变量的和的分布，其中每个变量\分别以概率0与 P 
取值0与1，其母函数为9 +声.于是 , 

{£>(^； n , p )} = {^(^; 1, p )} n *. (2.7) 

S fl = X, + • * • + x a 的表示法我们曾经使用过[例如在第九章 
例 （3. a ) 与例 '(5 j ) 中].颠倒以上论证中的次序就可得到二项分 
布的一种新的推导方法.又由乘法的性质 （g + ps^iq + psy = 
U + p ) m+ "有 

{ bQ ; m , p )} * { K 々； 》，/»)} — { K 々； f » + n , /»)}，(2.8) 
这与第六章 （10.4) 是同一公式.通过微分 G +外)”使可得到 
E(S„) =叶与 Var (S„) = npq 的一种简单的证明. 

(c) 普阿松分布.分布= e - l ^/ K \ 的母函数为 

切， (2-9) 

由此得 

{ K 々； A )} * { K 々； /<)} = {/>(々； 2 + 户)}， (2.10) 

这与第六章的 （10.5) 是同一公式.根据微分法我们又得到普阿 
松分布的均值与方差都等于 A 的结论. . 

(d) 几何分布与负二项分布. 设X是具有几何分布 

P{X = ^} = q K p , 々=0，1，2， … (2.11) 

的随机变量，其中 P 与《是满足条件 P + ^= l 的正常数.相应 
的母函数为 • 

B! t i] Cqsy = — . (2.12) 

*=o 1 I s 

利用第1节中的结果容易求得 E(X) = ql Pi Var (X) = ?/ 〆 ，这 
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与笫九章的公式 （3. c ) —致. 

在伯努利试验序列中 第一次成功恰好在々次失败后出现（即 
在第々+1次试验出现）的概率为故 X 可以解释为第一次 
成功所需的等待吋间.精确地说，这种解释涉及一个无限样本空 
间，形式定义 (2.11) 与随机变量的语言的优点在于，我们不需担 
心原本的样本空间的构造.以上所述对于第 r 次成功所需的等待 
时间也同样正确.设 X & 表示第 a -1) 次成功与第々次成功之 
间失败的数目，则 S r = X, + X 2 十 • • • + X r 为第 r 次成功之前 
失败的总数（于是 S r + r 为直到出现第 r 次成功所需的试验次 
数).伯努利试验的概念要求相互独立且具有相同的分布 (2.11), 
此处我们就用这个性质来定义于是 S r 具有母函数 



根据第二章的二项式展开公式 (8.7) 可立即得出/的系数为 


/(々； r , ^ ^ pX — qy ， 々= 0, 1，2,…. (2.14) 

由此立即得到 P { S r - = m r , p \ 这与第六章第8节所导 

出的第 r 次成功之前失败次数的概率分布公式是一致的.我们可 
将这个结果重述 如下： 分布 { KK \ r , p )} 是几何分布的重褶积， 
即 

{Kkl r , p )} = { q ^ pY *. (2.15) 

到目前为止，在我们的讨论中》•—直是正整数.在第六章第 8 节 
中我们曾指出，当〃 > 0 不是辇数时 {/ a ； r , /0}给出负二项分布 


的定义.此时母函数仍然由 （2.13) 来确定，易知，对于任意的 
r >0 负二项分布的均值与方差分别为 rq! t 与 巧/? 2 且 

{/(々；〜，？)}* {/(^； r 2 , p )} == {/(々 ； h + r 2 , />)}. (2.16) 


\ 在伯努利试验的初过与循环时间中的应用 

本节主要是给出理论的具体说明.以后我们将用不同的方法 
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导出本节中的结果(见第十三章例 (3- b ) 及问题7;第十四章第5 
节及问题11与 15—17). 本节结果在 p = 1/2的特殊情況已在第 
三章中得到.然而，下面的推导给出了母函数方法的一个卓越的 
例子; 此外，将不同的方法进行比较是有教益的. 

我们考虑成功概率为 P 的伯努利试验，如果第 々次试 验出现 
成功，则令\ = 1，否则令 X & = — 1. 于是 S rI = X 1 +_“ + 
_ x „ 为《次试验中成功比失败多出现的次数.用生动的赌博语言 
来说， S n 是在前《次试验中某甲所获的净赢利.为方倮起见，令 
So = 0. 

(a) 初过. 设某甲决定在第一次获得正的净赢利（其数量必 
定是一个单位)时退出赌博.直接列举所有可能情况便可看出，某 
甲只可能在第1，3, 5, 7, • ••次试验退出赌博，其相应的概率为 
P , qf , 2 qY , 5 〆〆 ，•…但一般性的规律不易看出.这些概率的 
和等于某甲的净赢利迟早要变为正的概率.这个量虽然不能用 
直接 的方法求得，但我们将 证明： 如果 P > q , 则 cr = l ; 如果 
则 = 等待净赢利增加到 T 单位相当于等待一个单 

位的净赢利接连增加*次.故某甲的净贏利迟早要达到 z 单位的 
概率等于 V . 下面我们来计算及恰圩在第》次试验吋某甲的净 
贏利第一次达到 * 单位的概率 

更形式地说，我们要求使得 S , < 0, S 2 < 0, • • •， Sd < 0, 
S „ = l 的概率更一般地说，如果 

Sj < A ：, S , < ar , • • •, S „_, < a :, S „ = ar , (3.1) 
则我们说初过声 ^>0 出现 在第” 次试验.这个事件的概率用 
又 t 来表示，4简便起见，我们令用赌博的语言来说， 
(3.1) 表示某甲的净赢利在第《次试验时第一次达到 * 单位.初 
过这一术语是由于在扩散理论中的应用而提出的. 

设初过 x = 1出现在第 r 次试验.以后的试验所产生的新》 
累积净赢利 S ; = X , +1 ， S : = x ,. +1 + x ,. +2 , • • * ,是独立 于前* ■次 

0 原书无“斩”字.而是分别用 cumulative 与 accumulated 两个词(都是 * 累积” 

之意）来表示与 S „， 以示区别 —— 译者注 
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试验的.当且仅当 s ;<0，•••， < 0, su = 1 时，初过 
^ = 2在时刻》出现，且这个事件的概率为 K - r . 换句话说，初过 
x i 与* = 2分别在第 r 次与第》> r 次试验出现的概率为又„ 
K - r . 于是我们有如下的 结论： 在吋刻”初过* =2的概率为 

又 = A 山 — 1 + 又丄 圓 2 + • •. + A n -iZu (3.2) 

令义。=(^，容易看出{^ 2 >} = { i „} * u „} M { U 的自褶积.引 
入母函数 

^*(0 = S 又 〆 ， A Cr) (0 = 2此)多"， (3.3) 

n s 1 0=1 

我们有 = ^( s ), 重复以上论证，由归纳法有 

A Cx > ( f ) =又’(，)• ' (3.4) 

于是我们的任务简化为寻求初过 * = 1的槪率.如果 Xi = 
1，则初过 r = 1在第一次试验发生.如果 X , » — 1,则在第一 
次试验后新累积净贏利必须增加二个单位，于是我们有 

又 1 = pi K = n > l . (5 5) 

上式显然等价于 A 0) 的一个二次方程： 

Z ( s ) — ps + qsX 2 { s '). (3.6) 

这方程的两个根中有一个在 f = 0邻近是无界的，另一个根 

X (0 = 1 — — W i l l (3.7) 

2 q $ 

是 （3.6) 的唯一有界解. * 

这样我们就求出了所有初过吋间的母函数 （3.4). 根据第二 
章的二项式公式 （8.7) 可以写出各系数 , 

== T -( l/2 ) (4^) m (- l) n, - , J = 0, (3.8) 

iq \ tn f 

不过我们感兴趣的并不是母函数的明确表达式，更富有启发性的 
是直接从母函数推出有关结论. 

首先注章 


1) 因为我们已经约定 S „ = 0 ——译者注. 
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X(l) = 1 ~ I 户 — ？ 1 ， <3.9) 

2 q 

故当 P > 7 时 A(l) = 1，当 P < 3 时 A(l) = p/q. 于是我们得 
到如下 结论： 等于 1 或 pfq, 就看究竟哪一个较小•，如果3大 
于〆这时赌博对某甲不利)，则 S „ 永远负的概率等于 G — zOA . 

在沪=? == 1/2的对称情况， S 恥==1;在接连投掷钱币的 
过程中，某甲确信他迟早将获得正的赢利.问 题是： 这需花多长 
时间？由；1/(1) = 可以 断定： 在投掷钱币的试验中初过 * = 1 
所需的试验次数具有无限的期望值.如果某甲想要在掷钱币的赌 
博中获得一个单位的赢利并在达到目的后立 即退出 赌博，则他应 
料到，所需试验的次数将是巨大的(因而也就需要有巨额的赌本). 
不用说，初过吋间的无限期望值与第三章中详细讨论过的掷钱币 
的出人意料的起伏特征是紧密相关的. 

附注 • 现在我们已求得 A , 的明确表达式，但还需从 （3.3) 或 （3.4) 来 
计算初过概率^\标准的分析程序是应用复变数方法.因此注意如下事 
实是有 趣的： 反射原理的简单应用使得我们在第三章第4节定理2中至少 
能躭 P - ? = 1/2的对称情况写出的明确表达式.（按照第三章中的记 
号，我们有/以^化 i »). 从（ 3 . 4 〕与（ 3 .7)可以看出，对于任意的 P 槪率 
K x ) 等于对称情况的相应槪率乘以 ^ P ^ Kpfq )^. 我们看到，最初等的 
组合分析往往能代替复杂的解折工具并能解决困难的专门问题;仔细领会这 
—事实是有教益的. ' 

(1>) 循环时间 4 如果 s 丨 4 0 ， s 2 9 ^ 0, • • •, s„_i # o, s„ »» o 

(即，如果成功与失败的累积数第一次出现平衡)，则我们说第一次 
返回零出现在第》次试验.设/„表示 k 个事件的概率.（显然对 
于所有的《，心 +1 = o. 用直接列举的方法不难求出 前几个 匕：/ 3 = 
2 辦 ， A = 2〆^， / s = 4/g- 3 , / 8 = 10/»V.) 

设为在第 》 次试验初过 x = — 1的概率，换句话说，; 
是在= I 中交换 P 与？ 而得的量.易知，在第《次试验第一 
次 1!> 返回零等价于 第”一 1次试验初过1 而第” 次试验出现失败 


1) 原书遗漏了“第一次”一词——译者注. 


• 285 • 



或第 》 — 1 次试验初过一 1而第”次试验出现成功 1 >，故我们有 

/« = qK-i + (3.10) 

乘以，并相加.注意到 {^} ^ { K ) 的母函数可由彼此交换 P 
与《而得，于是我们有 

FO ) = = 1 — (1 一 4卽 *) 吾 2> . (3.11) 

我们得到如下 结论： 成功与失败的累积数迟早将达到平衡的概率 
S/n 为 1 — — q \. 

在 P = i /2 的特殊倩況我们有= 1，但概率分布/ 
{/ J 具有无限的期望值.在第三章第4 节中， 我们曾用完全不同 
的方法计算出注意以下事实是有教 益的： 第三章的几个定理 
不需计算也不需 L 的明确表达式而可以直接从母函数 i 7 0) 得 
到.（见问题6— 10.) 

附注.在概念上，本节的问题与例 （2. d ) 中的等待时间问題是相似的. 
在伯努利试验的无穷序列样本空间中我们可以考虑被定义为从初过 r~l 
到初过〃所需的试验数(包括初过 r 那次试验在内）的随机变量 N ,. { N ,} 是 
相互独立且具有共同母函数 A (<) 的随机变量.和阶《>=~ + ••• + N , 为 
初过 f 的等待时间，其母函数为 A *( y ). 形式上，我们通过用分布来确定随机 
变量的方法避免了涉及无穷样本空 间”. 虽然从分析的观点来看_论 - 是严 _ 
格而完备的 （ S e l £- Co nt ai n M ), 但把这个自然的无穷样本空间记在心中对直 
观和概率解释是有好处的. ' 


. 4. 部分分式展开 

对于给定的母函数 fO ) == S / vS 其系数可通过微分法由显 
而易见的公式外 = p 〜( o ) A ! 求得.但实际上要求出明确的表 
达式并不总是可能，而且这样的表达式经常相当复杂，因此有必要 
考虑近似计算的问题.获得这种近似的最通常的方法是以部分分 
式的展开为根据的.由复变数理论可知，很大一类函数都可以这 


1) 原书在叙述中没有考虑第”次试验的结果;这是一个疏忽~ r 译者注. 

2) 原书遗漏了指数1/2 —— 译者注. 

3) 确切地说，应是由无穷序列组成的非离散样本空间 —— 译者注. 
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样展开，但此处我们仅就最简单的有理函数类来进行说明. 

设母函数具有形式 . 

P ( s ) = -^4, (4.1) 

17(0 

此处 1/(0 与 F0) 是无共同根的多31式.为简单起见，假定 C/(0 
的次数低于 V ( s ) 的次数此处，假设方程 F0) = 0有 w 个不 
同的(实的或虚的)根 b b 于是 

F0) = 0 — (^ — ii) • • * 0 — (4.2) 

由代数可知 p(0 可以分解为部分 分式： 


P0) = —+ — +•••■{ -^―， (4.3) 

心 —f Si — S S m —s 


此处 Pi， 内， * * ‘，是常数.为了求;将 (4.3) 两边同乘 h — j ; 
当 x — 〜时乘积— 0?(>)_趋 向于內 •’ 另一方面，由 （4.1) 及 
(4.2) 我们得 


ih — P0 ) = 


_ 一 Up ) _ 

0 — si) (i — j 3 ) … （j — s m y 


(44) 


当时分子趋向于 一 UCO, 而分母则趋向于 Oi — h ) Oi—sO 
…0! — •!»>).，后者就是 v'Oi ). 于是 pi = — uGO / y %) .同 
样的论证适应于所有的根，故对于々^有 

- uQk ') 


pk 




(4.5) 


不幸的是，将 (4.1) 写成 (4.3) 的形式通常需要进行多方面的 
数值计算.然而，一旦获得展开式 (4.3), 我们就能容易地导出 
PCO 中 f 的系数的精确表达式.置 


_J__ = 丄_ 

Sk~~ s s k 1 一 s / s k 


(4.6) 


当 M < 1^1时，我们可将最后的分式展开为几何级数 



以上式代人（4.3)，我们就求得^的 系数九 


(4.7) 
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九 =古 + 含+ … > ⑽ 

s 2 5 m 

于是，为了得到 h 我们必须首先求出分母的根^， •…， &，然 
后由 （4.5) 确定系数 pi ， 

在 （ 4.8) 中我们有概率 九 的一个精确表达式.为计算〃个根 
通常需要付出大量的劳动，故公式 （4.8) 主要是具有理论上的价 
值.幸运的是 (4.8) 中有一项几乎经常给出良好的近似，事实上， 
设^是一个根，其绝对值比所有其它根的绝对值都要小.则 （ 4.8) 
中的第一个分母最小.显然，当〃增大时，其它各项所占的比例递 
减而第一项则起主要作用.换言之，如果 h 是 V ( s ) = 0的一个 
根，其绝对值比所有其它根的绝对值都要小，则当《 — 00吋， 

，”〜 f ( 4 . 9 ) 

(符 号〜 表示两边的比趋向于 1). 通常，甚至对于较小的”给出 
的近似也非常好. （4.9) 的主要优点在于它仅需计算代数方程的 
一个根. 

容易除去在推导公式 （4.9) 时所作的限制.首先， （4.1) 中分 
子的次数可以超过分母的次数.设 U ( s ) 的次数为 W + r(r > 
0); 用除法就可把 PCs ) 化 为一个 r 次多项式与一个分式 IhisV 
V ( s -) 之和，其中 17,(0 是次数 i 氏于历的多项式.多项式仅影响分 
布的前 》■ + 1项，而如上面所阐明的 tAW / PO ) 能展开为 
部分分式.于是 (4.9) 仍成立.其次， F 0) 无重根的限制也是没 
有必要的.由代数可知,每一个有理函数都可以展开为部分分式. 
如果4是 F (^) 的一个二重根，则部分分式展开式 (4.3) 将包含 一 
个形如 a/(s - s k y 的付加项，这将使得 h 的精确表达式 （4.8) 中 
增加形如 《(« + 1) <” +2) 的一项.然而，只要 h 是一个单根，这 
并不会影响渐近公式 (4.9). 我们将这个结果写成如下的定理以 
备将来 参考： 

定理. 设是一个有理函数，其分母有一个单根 b 这个根 
的绝对值比所有其它根的绝对值小1则 r ” 的系数由％〜^： (0+0 
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渐近地给出，其中由 (4.5) 确定. 

在心 为重根的情况也有类例的渐近公.式.（见问题 25.) 

例 .G) 设〜为 《次伯努利试验中出现偶数次成功的概率. 
这个事件等 价于： 第一次试验出现失败而随后 《 — 1 次试验中出 
现偶数次成功或第一次试验出现成功而随后《 — 1次试验中出现 
奇数次成功.故 

On = 4- p(\ — a a = 1 . (4.10) 

乘以，并相加，我们便得到母函数 20) 所满足的关系式 
A (s') —1 = qsAQs) + ps(\ 一 ’)~ 1 一 psAO'). 

由此有 ^ A ( s ) =-{1 - f}- 1 + p ) s }-\ 

2a „ = I + (q — p ) n . (4.11) 

我们注意，最后的公式在各方面都比显而易见的解答= 
办 （0;ra，p) + b {2 ;«,/») + ••• 更为可取. 

(b) 设％为在一个理想钱市的》次投掷中不出现长为3的 
正面违贯的槪率.（注意并不是概率分布；如果 h 为第一个 
长为3的正面连贯在第《次试验出现的概率，则 {?„} 是一个概率 
分布 ，而心 则表示其“尾部”，即办= 九 +1 +九 +2 +… .） 

. 容易证明心满足递推公式 


qn — ' 《 n -1 + —2 + —~ qnS 

2 4 8 


(4.12) 


事实上，仅当试验以 T ， Hr 或 HHT 开始时，才有可能在》次 
试验中不出现序列 HHH. 随后的试验不出现连贯的概率分 
别为 q n - i 与％ -3,故（ 4 .1 2 )右边的三项正是使得“无连贯 
hhh ,3 出现的三种互不相容的方式的概率. 

显然价=?! = ^2 = 1, 故心能 依次由（ 4 .12)算出.以，乘 
两边并相加便可求得母函数 Q 0) = ^ q n s \ 我们有 
Qi.s') — 1 — s — s; 

= ~ {p00 — 1 — f} + — {p(0 — 1} + — Q{s) 

2 4 8 


或 
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的） = 


2s 2 + + 8 

8 — 4^ — 2s 2 — 


(4.13) 


分母有一个实根 A = 1.0873778 ••-及两个复根.当 M < h 时 
我们有+ 2? + /| < 4心+ 24 + 4 = 8,当卜| = A 且 f 与之 
时这个不等式仍成立.故其它两个根的绝对值大于^于是由 
(4.9) 有 


〜 1-236840 

q " 〜 (1.0873778)" +1 ’ 


(4.14) 


其中分子等于 （2 d + + 8)/(4 + 4^ + 3 s \-). 甚至对于”的较 
小值这个公式给出的近似也非常好.例如 对于仍 = 0.875 与办= 
0.8125, 这个公式所给出的近似值分别为 0.8847 与 0.81360. 随着 
«的增大，百分误差逐渐减少，由此式算出的仍 2 =0_41626, • •精确 
到五位小数. 


5.二元母函数 


设 X, Y 是两个取整数值的随机变量，其联合分布为 

P{X = /, Y = ^} == p lKi /，々 = 0，1， •. (5.1) 

我们称依赖于两个变数的函数 

S 2 ) = 2 p jk si sf (5.2) 

hk 


为二元母函数. 

头两节中的考虑也适用于现在的情况而不必作本质的修改， 
指出下列三个可直接由 (5.2) 得出的明显性质就已 足够： 

(a) 边缘分布 P{X = /} 与 P{Y= 0 的母函数分别为 A(s) 

= P ( y ，1) 与 =尸(1 〆 ). > 

( b ) X + Y 的母函数为 . 

(c) 当且仅当 p(s t , s 2 ~) = AisO 5(0) 对于所有的 A 与 O 成 
立时，变量 X 与 Y 相互独立. 

例 .（ a ) 二维普阿松分布. 显然 
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POi , Si') == 疒 a; > 0, 办 > 0 (5.3) 

可展开为幂级数，其系数为正且系数狗和为 1. 故 PG , d 表示二 
维概率分布的母函数.其边缘分布分別为具有均值 A +6与 a s +b 
的普阿松分布，但和 X + Y 具有母函数 e - a ^- b+(a ^ )i+ ^\ 故它 
不是普阿松变量.（它是一个复合普阿松分布；见第十二章第2 
节 .） 

( b ) 多项分布. 考虑一个》次独立试验的序列，每次试验分 
别以概率如 ft ，朽出现结果 E 13 £ 2 .如果 X ,.是出现 E ,_ 的次 
数 3 则 d x 2 ) 具有母函数为（九+灿+ Plh y 的三项分布. 

*6 .连续性定理 

在第六章中我们曾证明，普阿松分布 MV 々!} 是当《 — 00 
时具有概率 P 的二项分布的极限形式，其中^依赖于《且当》— 
O 0 时坤- ♦；?>• 即 K 々； H 〉— P /々!. { K 々； 》，/ 0} 的母函 

数为& + psY = {1 - Ul - s )/ n }\ 通过取对数我们立即可看 
出这个母函数趋向于^ Kw ) ， 卮者为普阿松分布的母函数.我们 
将证明这种情況可以推广到一般；概率分布收敛于一个极限分布 
的充要条件是对应的母函数收敛.不幸的是这个定理的应用范围 
不广，因为最有趣的离散分布的极限形式是连续分布(例如正态分 
布是二项分布的极限形式). 

连续性定理. 设对于每个固定的《，序列私》， 


是一个概率分布 ，即 


史 =0 

(6.1) 

使得对于每个固定的4当》 —• oo 时 


an ，,,-* 

(6.2) 


成立的充分必要条件是对于满足条件0 < r < 1_的每 个/有 


后面并没有用到本节的内容, 
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^nO) ( 6 . 3 ) 

此处 

a> as 

= S a bnS K , A O ') = 2 (6.4) 

«=0 考 =0 

表示对应的母函数. 

附注. 如果 （6.2) 成立，则自动地有0< 

故至少对于 UI < 1母函数存在.然而，极限序列{~}不一定是 
概率 分布； 例如，如果分布{^,„}的前》项为0,则极限序列恒 
为 0. {~}为概率分布的充分必要条件是= i 或 J ( l ) = 1. 

证》首先假定 （6.2) 成立.对于固定的 K 0< i < l ) 与固 
定的 6 我们能选择 r 使得 ^(1 - ^) < e . 于是 

r 

M»(0 — ^0)1 < I a K，n ~~ + 2e. (6.5) 

*=o 

右边的和仅包含有限项，其中每一项都趋向于零.故当”充分大 
时可以任意小.其次，设 （6.3) 成立.我们将利 
用如下的众所周知的事实 2) :从所给的分布序列中一定能够求得 
一个收敛的子序列.~果 (6.2) 不成立，则一定能够选出收敛于不 
同极限序列与 wn 的两个子序列，于是 { am ')} 的对应子 
序列分别收敛于 A *0~) = 与= S 4 V . 然而，这 
与假设 （6.3) 矛盾.故由 （6.3) 可推出 （6.2). 

例. （ a ) 负二项分布. 在例 （2 .幻中我们曾看到，分布 {K 七 
r , p )} 的母函数为 〆 (1 — qsY \ 现在令 A 固定，并令/ • — 1， 

? -»• 0,使得《= A / r . 则 



1) 这个定理是拉普拉斯-斯提杰变换的连续性定理的一个特殊情况，此处的证明 
是仿照一般情况的证法来叙述的.在文献中，母函数的连续性定理的叙述与证 
明通常附加了不必要的限制. 

2) 这个事实是箸名的結利 ( Helly ) 定理的一个特殊情况，它容易用康托的 a 对角 
线法”来证明，这种方法可在任一本关于集合论的书中找到.（参见 n . 那 
汤松,实变函数论， P . 247——译者注 
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通过取对数可以看出，右边趋向于这是普阿松分布 {dV 
々!}的母函数.故如果》> go 且 — 则 

Kk ； r, p) - (6.7) 

々！ 


( b ) 具有可变概率的伯努利试验. 考虑》次独立试验，其中 
第々次试验出现成功和失败的概率分别为 以与如 =1 一外.成 
功数 s „ 能够写成《个相互独立的随机变量 Xt 之和 s a = K + 
…+ x „ ，其中的分布为 P { x ^ = o } = 《 4 ， P { x 々 = 1 } = /»*. 
x , 的母函数为呶+ / V ，故 s „ 的母函数为 

P(-f) = (?1 + Pidiqi + pj) •*•(?«+ p n s). (6.8) 
作为以上概型的一个应用，我们假定某城市中每个住户在指 
定的一天发生火灾具有小概率则和内+ • • • +九为一天中 
火灾的期望数 ，"则 为住户数.在 第六章 中我们曾看到，如果所有 
的九 都相等且各个住户随机独立，则火灾数是一个近似于普阿松 
分布的随机变量.现在我们症明，在内并不相等的更为现实的假 
设下上述结论仍成立.这个结果使我们进一步相信普阿松分布充 
分地描述了那些可以看成是很多小概率事件(“成功”)的累积效应 
的现象.意外事故和电话呼唤是典型的例子. ' 

现在我们采用变量数目增加的模型，其中办依赖于》使得 
A + +…+ =又为常数.于是由（ 6 . 8 )有 


log i°0) = log {1 — PkO — 0). (6.9) 

l 

因为朽 — 0,故我们能利用等式 log (1 - = -x - dx , 其中 

当*-*0时 0 —0. 由此有 


logPCO =* ~(1 1 2 (a + — —A(1 — s), (6.10) 


故 PO) 趋向于普阿松分布的母函数.因此， s „ 的极限分布为普 
呵松分布.我们得到如下 结论： 对于大的》与中等大小的 x= Pi + 
九+ ••• +仏， s n 的分布能用普阿松分布来逼近[参见第九章例 
C5.b).l 
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7 .问 题 


1 . 设 x 为具有母函数 pO ) 的随机 变量. 求 x + i 与 2 X 的母函数. 

2. (:续上).求以下各数列的母 函数： 

( a ) P{X < ( b ) P{X < „>, ( c ) P{X > »}, 

( d ) P{X > « + 1}, ( e ) P{X = 2n}. 

3 . 设〜 是伯努利试验中第一个组合在第》_ 1次与第”次试验中 
出现的概率.试求母函数、均值与方差. 

4. 试讨论在第二章第12节中哪个公式表示褶积，在什么地方用到了母 
函数，. 

5- 将一个骰子掷任意多次. 设〜 为使得出现的点数之和为《的所有 
可能方式的数目.试证明 {«»} 的母函数为 

注意 . 问题 6-10 参照投掷钱市的例子中的通常记号，其中它们包含第 
三章所求得的某些关系的一■种直接推导•令 = = 0}, /» = P{Si ^ 

0, • • • , S „_, 5^ 0, S „ = 0} (初次返回）；按定义，«0 = 1 S /u •= 0. 我们假定 
{/,} 具有母函数只_0 = 1 — {1 一巧 1 〃为已知（由第 3 节)，此外不作其它假 
定.几乎不用计算，也不需关于系_的明确公式. 

6. {«,} 的母函数为 = {f — 

7. 直到吋刻2” 不出现0的概率与 S „ = 0的概率相同. 

8. S 2B 0且所有的和 S 13 S a ， ••_，3 2 „都 >0 的概, 率奪于 2 firi+i» 

9 . 第一次变号紧接着第2»次试 验后出 现的概率等于 ％» +2 . 

10 . 在和 s l} •••, s „ 中恰有4为 o 的概率具有母函数户0) vO) 
• (I + 0 . 


11. 在 P > <?的伯努利试验序列中设为存在指标 7' > »使得 _S; =• 0 
的 概率. 试证明 A 的母函数为 ^[p - 7 + Cl - 4p^)«^]- , (l + 0. 

12. 在第九章的等待时间的例 （3.d) 中求 S,(r 固定)的母函数.证明 
第九章的均值公式 （3. 3 )并计算方差. 

13. (续上).下面是推导同一结果的另一种方法 • 设&0) = P{S, = 
«>. 证明递推公式 

?»+.(>•) = r :丄 Pn ( r ) + . A - 一 二 . 亍丄 p«( r —丨). （7.1) 

A A 
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直接由 （7.1) 导出母函数. 

H . 对于预先指定的 r 个元素(代替任意 r 个元素)解以上两个问题 
15°. 我们称直到第一次失败为止的伯努利试验序列为一轮 ( turn ). 试 
求"轮中成功累积数 S , 的概率分布与母函数. 

16. (续上)设 R 为直 到第 v 次成功的接连的轮数(即 ,第 v 次成功在第 R 

轮中出现).证明 P{R = »■} = PV — (" ^~ 2 ).求 E ( R ) 与 v ar ( R ). 

17. (续上）考虑分別具有概率 < h 与梦一 的两个伯努利试验序列， 

证明 N 次成功所需的轮数相同的概率可以表示为 _ 

“广 (…一 

v — 1 / 

il* /N — 1 \i 

= (PiPO N (i — 《而 ) l_iN 2() (⑽) *• 

AcaO \ 々’ 

18 . 设 { X *} 为相互独立的变量，每一个都以概率 1/ a 取值 Q , 1，2, 

« - 1. 令 S , = X , + . • • + X «. 证明 S a 的母函数为 



因而 

、 叩-…卜去！… 1 ) 一 (:)(二). 

(在和式中仅有有限多项异于 0.) 

注意.当《 = 6时我们就得到在掷”个骰子时出现的点数和为；+ # 
的概率.这个问题的解曾由德模佛给出， 

.19. ( 续上)概率的母函数为 P ( J )/(1 —0,故 

p ⑽=去 ？(-”-(:) (’：⑽). 

20. 续上：极限形式，如果 — CO，i — 00,使得） /fl — J ：， 则 


1) 问题15— n 与台球游戏有直接的联系.成功概率 p 是游戏者技术好坏的一种 
量度.游戏者一直玩到失败为止.故他所累积的成功数就是他的那一“轮”的 
长度.游戏一直进行到有_人获得 W 次成功为止.因此问题15给出一个游戏 
者获得々次成功所需的轮数的概率分布，问题16绐出平均轮数，问题17洽出 
两个游戏者的比赛出现平局的概率，进一步的讨论可参见 [8] , 
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P{s»<；>-»^- 2 ( 一 1 r(:) o -*0% 

其中和是对所有满足 o < w < * 的 〃 来求的. 

注意. 这个结果是由拉格朗日 （LagMnge) 得到的.在几何槪率理论中 
右边表示具有区间（0, 1) 上的均匀分布的》个独立随机变量之和的分布. 

21. 设〜为 》次伯努利试验中的成功数能被3除尽的概率.试 求〜的 
递推关系并由此求出母函数. 

22. 续上： 另一种方法.设〜与％分別表示 S » 具有形式 3 r + I与 
^ + 2 的槪率(故 h +〜+ % = 1). 试求三个联 S 递推关系并由此求出 
母函数所满足的三个方程. 

23. 设X与 Y 是具有母函数 £7(0 与 V(<) 的独立变量.试证明 P{X — 
Y =)} 是 1/(0 V(1A) 中 P 的系数，其中 > = 0, 土1，±2,…. 

24. 矩母函数. 设X是具有母函数的随机变量，设对于某个〜>1, 
SP,:* 收敛.则所有的矩卟= E(V) 都存在，旦序列 m f / r \ 的母函数 F ( s ) 
至少当卜 | Clog 々吋收敛.且 

外 ）= Z 

，雏 0 

注意 . 汽0逋常称为矩母函数，虽然实际上它所产生的是 《,/»•!. 

23.设卓0 = 为有理函数且〜为以0的一个根， 

其绝对值比所有其它根的绝对值都要小.如果 A 具有重数 S 试证明 

a ，〜 I { n+ r-l 1 ) 3 

此处= 一！吵 丨)"⑴⑷ • 

26, 二雏负二项分布.试证明当参数值为正时对 {1 一 PA 一朽以〜为 
(X， Y) 的分布的母函数，其中X、 Y 与X十 Y 的边缘分布为负二项 分布' 


1) 贝 - 茨 （ G_ E. Bates) 与内曼 〔 J. Neyman) 在硏究意外偏斜 〔accident prone- 
neSS ) 时曾使用过这种类型的分布 . 见 [9]. 
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*第+ 二章复合分布•分支过程 

1. 随机个变量之和 

设{X,}是独立同分布的随机变量序列，其共同分布与母函 

数分别为 P{X 4 = ；} = A 与/0) = 我们常对形如 s w = 

X, + X 2 + . • • + X N 的和感到兴趣，此处项数 N 是一个独立于 

X；的随机变量.设 P{N = „} = 为 N 的分布，= Sp” 

为其母函数.由条件概率的基本公式可以求出 S N 的分布{七} : 

«0 

hj = P{ Sn = /} = P{N = w}P{X! + * * * + X„ = /} • (1.1) 

如果 N 仅取有限多个值，则 S N 定义在有限多个的样本空 
间上.否则 S N 的概率■定义将涉及无穷序列 {XJ 的样本空间，但 
我们仅考虑 s N 的概枣分布，并以分布 （1.1) 作为由点0,1， 2 ,… 
所组成的样本空间上的变量 Sn 的定义. 

对于固定的 n, Xi + X, + • • • + X„ 的分布由 {/;} 的》重自 
褶积给出，故 C1.1) 可写成如下的简洁形式 ： 

{Ay} = 1 ： gAfiV*. . (1.2) 

f»sO 

利 用母函 数可将这个公式加以简化.的母函数为 7 a O ), 于 
是由 （1.2) 易知， S N 的母函数由下式 给出： 

h i s ' = S ?”/"(，)• (1-3) 

’ / =0 «=o 

上式右端可由在〆 o 的泰勒展式中用 /o) 代替 < 而得•，故它等于 
K/0)). 这就证明了如下的 


后面没有用到本章的内容. 

V 
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定理. 和 S N = K +…+ X N 的母函数是复合函数 g (/0)). 
以下是两个有趣的特殊情况. 

( a ) 如果 X ,.是伯努利变量，其分布为 P { X , = 1} 

P { X ； = 0} = 《，则 fO) = g + 〆 ， 故 hi/) = giq + pi), 

( b ) 如果 N 具有均值为 £ 的普阿松分布，则 

h(s) = e - t+tto \ 0-4) 

以此为母函数的分布称为复合分布 . 、 

如果 X ,为伯努利变量， N 具有普阿松分布，则 p + w ; 
和 Sn 具有均值为 P 的普阿松分布. 

例 .（ a ) 在第六章例 （7. c ) 中我们看到， X 射线引起细胞中染 
色体的分裂；对于一定的剂量和曝光吋间个体细胞中的分裂数 N 
具有普阿松分布.一个分裂的染色体恢复原伏的概率为？，而细 
胞死亡的概率则为 p = 1 — 此处 Sn 是观察到的分裂数 [1 ° ] ，它 
具有均值为 W 的普阿松分布. 

( b ) 在陷兽井实验 [1 U 中^表示一兽类共有”只野兽的概 
率.如果每只野兽陷入的概率均为.?，则(假定统计独立)被捕获 
的一类野兽的只数 S N 是一随机变量，其母函数为+芦).以 
上的叙述可用多种方式加以改变.例如，设 L 为一只毘虫产》个 
卵的概率，而 P 为每个卵成活的概率•则 S N 为成活的卵数 ■又 
如，设心为一个家庭有 n 个小孩的概率 3 并设小孩的男女性别比 
为则 S N 表示一个家庭中的男孩数. 

( c ) 每株植物都有大量的种子，但每粒种子成活的概率很小， 
'故有理由假定个别植物的种子的成活数具有普阿松分布.如果心 
表示亲本植物数的分布，则 s 0 ~ l + ls ) 为成活种子数的母函数. 

2 . 复合普阿松分布 

首先我们考虑两个典型的例子 • 

例 . （ a ) 设在长为 < 的一段时间内被闪电击中的次数是均值 
为; U 的普阿松变量.如果为个别电击所造成的损失的概率 
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分布，则(假定统计独立)在长为 < 的一段时间内遭受的总损失的 
概率分布为复合普阿松分布 ' 

{ hj } = 2] ^-⑹ 》V 
»! 

其母函数为 ’ 

h { s -, i ) = . (2.1) 

( b ) 在生态学中假定一个小地区中野兽窝的个数具有普阿松 
分布，其均值与这地区的面积成比例.如果 { AJ 为一兽窝中野兽 
只数的概率分布，则 (2.1) 为这地区的野兽总数的母函数. 

在第六章中我们看到很多依赖于时间或空间的现象服从普阿 
松分布，前面的例子则表明复合普阿松分布也经常与这类现象有 
关. 

母函数 (2.1) 具有如下的显著 性质： 

h { s \ h + i 2 ) = /；0; /,) h ( s ; / 2 ). (2.2) 

对此可作如下的直观描述.对于每个长为 t 的一段时间有一个母 
函数为0的随机变量与之相应，我们称它为这一段时间的基 
值 ( contribution ). 两段不相重迭的吋间的基值是相互独立的，这 
赛味着当一段时间 t-h + h 分割为两部分时，其基值 X (0 = 
k(o + X (0 也彳目应地分解为两个独立随机变量之和 .. 

在下一节我们将证明(在取整数值的随机变量中），仅有复合 
普阿松分布具有这个性质.在阐述定理之前我们先来看两个例子. 
例 .（ c ) 负二项分布的母函数为 

s ') ^ 土; ) p + q =^ l , (2.3) 

易证 (2.2) 的确成立.故负二项分布是一个复合普间松 分布; 令 
* A = log 丄，/0) = -^- log — ^—, fn = — J (2.4) 

即可将 （2.3) 写成 (2.1) 的形式.分布 { Iq ' in } 称为对数分布. 

( d ) 多重普阿松分布. 设我们按所卷入的车辆数将汽车事故 
分为单车事故、双车事故等类.并进一步假定单车_、双车等事故分 
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别具有均值为 心， • ••的普阿松分布，且各类事故是统计独立 
的 .， 于是在长为£的一段吋间内发生事故的车辆总数的母函数为 


AjiCl— j) A 2 Kl—J" 3 ) 亡一怎 • 


(2-5) 


这又是一个复合普阿松分布，其中 A = /* = hlk 反之，每 

个复合普阿松分布都可以改写为 (2.5) 的形式，故我们也可将复 
合普阿松分布解为单个事物、成对事物等的累积效应. 


丄无穷可分分布 


我们称槪率分布{屯}，/ = 0, 1， •“ 为无穷可分的，如果对 
于每个》它可表示为另一概率分布{扣}的》重自褶积，亦即，如 
果它的母函数 KO 的一个《次根 h Vn ii ) = < Ks ) 产生一个概率分 
布 {</>,}. . 

注意，如果 满足（2.2)，则 A (>， 0 = h n (j\ t/ti), 故对 

于每个 G h ( siO 都是无穷可分的.上节的论断包含在如下定理 
中（这个定理是列威关于任意概率分布的一个重要的一般定理的 
特殊情况). 

定理. 如果是无穷可分的，则其母函数能写成 （2.1) 的 
形式(比方说式=1>. 

[注 意： 满足 （2.2).] 

证.设对于每个〜 _{/) 为一概率母函数.这仅当 A (0) = 
h o > 0 时才有可能.故 h ( s } 必定在某区间 M < « < 1内为正且 
在这个区间内我们有0 < 1 — hO ) < 1. 由此可知 log A 0) = 
log (1 — U — A 0)}) 可展开为泰勒级数 

00 

log A(s) 口 X〆 — a -< s <1 a m (3.1) 

i=0 

令^ = 0即可看出 Z 。 < 0. 我们要证明所有其它的 A 都是非负 
的.用反证法证之，设命题不成立并设1是使得总 < 0成立 
的最小足标.为书写简便起见，令 * 
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义 〆 ' ~ XjfS 9 , — — (3.2) 

v = l v =r +l 抑 

于是有 

p / n { s ') = e tX « - e tAU) ' e sX 〆 . e sBis \ (3.3) 

由假设有 a 1/ b 0) = 其中和 > o . 考虑式中，的系数 A . 

幂级数 5(0 仅包含次数大于》•的各次幂，敌它不会影响到屯. 
因此屯是 

f ^ o(l + eA { s ) + — e J Z 2 C 0 + …) (1 + BX r O (3.4) 

中，的系数.因为 /(>) 是次数< r 一 1 的多项式，故我们有 

4 >, = e tX °\ sX r 4- e 2 />( e )], (3.5) 

其中是 e 的一个多项式.如果如反证法所假定的 A < 0 ,则 
当 s 充分小时 (3.5) 的右边将为负，于是屯 < 0,而这是不可能的 .- 
这就证明了 Z f ^ 0 5 ，- = 1 ， 2 ,….此外我们有 A ( l ) 7 1 ，故 
log A ( l ) = ZX = 0 ，即 一 A = A + A + *... 宁是只要令 
_ X 0 = m = Xi / X 就可将 AO ) 写成 C 2.1) 的形式(其中 /= 0. 

4. 分支过程的例题 

我们将讨论一种随机过程，它可作为很多经验过程的简化模 
型，也可用来说明母函数的用处.这个过程可以描述如下. 

我们考虑一种质点，这种质点能产生新的同类质点.我们称 
最初的一个单独质点为第零代.每个质点恰好产生々个新质点的 
概率为 p k (X — 0, 1, 2, . • •) ;第》代质点的直接后裔构成第” + 

1 代.每代各个质点彼此独立.我们所关心的是各代质点的数目. 

在用随机变量的术语作严格的讨论之前我们先来考虑几个例 
子. 

( a ) 核链锁反应. 这个与原子弹有关的应用是大家所熟知 
的 1 >. 质点为中子，它们易与其它质点发生偶然碰撞.设？为质点 

1) 下面的讨论遂循 ri2]. 在那里取消了空间均匀性的餒设. v 
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迟早要碰撞一次因而产生 W 个质点的 概率； 于是7 = 1 — 为质 
点无后裔的概率，亦即质点始终不活动(换句话说,即被消除或吸 
收)的概率，在这个概型中后裔的数目只能为0 和其相应的 
概率分別为 0 与 /> ( 即 P 。 = ?，= /»，对于所有其它的/，朽= 
0 ). 在最坏的情况，最初的那个质点始终不活动因而过程未曾开 
始.在最好的情況，第一代有 m 个质点，第二代有 W 个质点，等 
等.如果 P 接近 1 ，则质点的数目很可能异常迅速地増大.从数学 
上说，这个数目可能无限增大.从物理上来说，当质点数目很大 
吋，裂变的概率不可能始终为常数，统计独立性也不再成立.不 
过，对于普通的链锁反应来说，可将“质点数无限增大”的数学描述 
翻译 为“爆炸”. 

( b ) 姓氏的存亡. 这里(如社会习惯中那样)，仅考虑男性后 
代；他们起着质点的作用，八为一个新生的男孩将成为恰好々个 
男孩的祖先的概率.我们的概型作了两个人为的简化.事实上，生 
育的多少会受到世俗倾向的影响，故分布{^}实际上是逐代改变 
的.此外，共同的遗传和环境必定引起兄弟之间的相似，而这是与 
我们的统计独立性假设相矛盾的.我们可以将模型加以改进以消 
除这些缺点，而不会影响其本质特征.我们将导出某家族有々个第 
«代子孙的概率，特别是谱系灭绝的概率.姓氏存亡问题似乎是 
用概率方法所研究的第一个链锁反应.首先讨论这个问题的是格 
尔顿 (1889); 有关这个问题的详尽叙述读者可参看洛特卡的书 H3] . 
洛特卡 证明： 美国的经验资料可以很完美地用分布 Po = 0-4825, 
p k = (0.2126) (0.5893 广 1 (々> 1) 来描述，除第一项外这是一个 
几何分布. 

(c) 基因与突变. 有机体中的每一个基因（参见第五章第 5 
节）都有机会在 H 3,…个直接后裔中再现，我们的概型描述 
这个过程，当然.忽略了总体内部以及随时间的变化 . 1 这个概型在 
突变 [14] 或基因类型的变化的研究中特别有用.一个自发的突变 
产生一个单一的新型基因，这个基因起着零代质点的作用.这理 
论可用来估计突变基因的传播与生存的机会.为确定起见，考虑 
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(遵循 R. A. 费歇)一个植株， 它是某 100 颗种子的父体和男100颗 
种子的母体.如果总体的大小始终不变，则这200颗种子中平均 
有两颗将成长为植株.每颗种子得到一个特定基因的概率为 1/2. 
故一 个突变 基因恰好在々个新植株中表现出来的概率相当于概率 
为夕=1/200的200次伯努利试验中恰出现々次成功的概率，于 
是有理由假定近似地为均值等于1的普阿松分布.如果基 
因街带一种生物学上的优势，则我们得到均值；I > 1的普阿松分 
布， 

( d ) 排队问 题 [1 \分支过程的理论可以用来分析(:在邮局、电 
话等中）排队的起伏现象.在柜台空着时来到因而不需等待的一 
个顾客称为 祖先； 在祖先的服务吋间内来到并参加排队的顾客是 
他的直接后裔.只要徘队还在进行 3 这个过程就持续下去.在这 
个例子中我们所感兴趣的是直到排队终止时刻的后裔总数 .' 


5. 分支过程中的绝灭概率 

为从数学上描述这个过程，令 X„ 表示第《代的大小.由假设， 
Xo = 1, X,具有已给的概率分布 { p k ), 其母函数为 P ( s )= Zfi k s \ 
第二代由第一代的X,个成员的直接后裔 组成； 换句话说，我们把 
X,看作是X,个相互独立的变量之和，其中每个变量都具有母函 
数 K:). 根据第1节中的定理， x 2 的母函数为 p 2 0)=<PCPO)). 类 
似地， X 3 为X,个变量之和,其中每个变量具有与X:相同的分布， 
故 x 3 的母函数为== p ( p 2 ( s ) y . 由归纳法可知，一般说来，第 
» + 1代中的质点数 x„ +1 的母函数 P„ + ,0) 由下式递推地定义： 
= P(0> P a+ lO) = P(PnO)). (5.1) 

在例 （4.a) 中 P(s~) = ^ + ps m ;于是 P 2 0) = q + piq + ps m ) m , 
Pi ( s ) =? + >{《 + 〆《 + ps m Y ) m , 等等. 对于普阿松分布 PCs ) 
=等等 .这 些公式并不十分讨人喜欢， 
但能由此得出重要的结论. 

,我们来求过 程在第》代或在此以前终止的概率％，即 A == 
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P { X „ *= 0} = P (0). 如果內 一 \>， 则绝灭为不可能，故我们假定 
0 </.„< 1. 由定义易知 ，〜随 》增大.这个事实可用解析方法 
证明 如下. 在区间0 < ^ < 1中函数尸0)是单增的 1 \又我们有 
Xi = P (0) = po. 故 *3 = P ( a - i ) > P (0) = x t3 又由归纳法有 * n+ t 
= PO ») > P ( r B _,) = x„, 由此可知序列*' n 单调增加地趋向于某 
个数 G 显然 C 满足方程 

卜 Ka (5.2) 

如果«> 0是方程《 = P («) 的任一根，则 A = P (0) < P («) = « 
又由归纳法可得 A +1 = P (^») < ■?(«) = «，故有 S < « 2 ).因此， 
x n 趋向于 (5.2) 的最小正根. 

由于 y == PO ) 的图形是凸的，故这曲线与平分线 y ==，最多 
交于两点.它们的确在点 (1,0 处相交，故方程 (5.2) 最多能有一 
个根 o < f < i . 如果这样的一个根存在，则差商0 — P ( D }/ 
(1 - ?} 等于1，于是由中值定理可知在 f 与1之间存在一个点 
* 使得导数 P ' O ) = 1. 由此知仅当，(1) > 1吋 （5.2) 才有可能 
存在一个根^ <1. '另一方面，如果 P '( l ) < 1，则 {1 一 K 0}/ 
{1 - 4 < 1对一切^ < 1成立，而这蕴含 P 0) > 1;故户0)的 
图形位于平分线的上方因而（5. 2 )无根 • 这就 证明： 方程（5. 2 ) 
存在一个正根 （< 1的充分必要条件是 〆 (1) > 1，且这个根是唯 
一的.已知 P '( l ) = 是每个质点的直接后裔数的期望值，故 

我们有如下的基本 结果： * 

设户= XKPk 为一个单一质点的直接后裔数的期望值.如果 
A * < U 则过程将在第《代以前终止(即 X n = 0) 的概率趋向于1 . 
如果> 1，则 (5.2) 存在唯一的一个正根 [ < 1，【为过程在有 
限多代后终止的概率的极限. 

差1 — C 可称为过程无限延长的 概率. 通常〜迅速地收敛 
于？，故一个有穷尽过程差不多仅能延续很少几代.所以，【实际 


1) PG ) 在区间（0, +0 O ) 上也是单调增加的，下面证明 *, <«时要用到这一事 
实 —— 译者注. 

2) 原书误为§ < « - 译者注. 
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上就是迅速绝灭的概率.在例 （4. c ) 中我们可称1 — t 为突变基 
因得以传下去的概率.我果我们不从单一质点而是从 f 个质点开 
始，则所有 》• 个谱系都将逐渐灭绝的概率为 r ， 而至少有一谱系 
延续下去的概率则为1 一 r . 即使 c 比较大，当初始数很大吋 
1 一 r 仍接近 i . 在例 (4. a ) 的核连锁反应中情况就是这样，因此 
我们可 以说: 如果> 1，则爆炸的概率接近1 ，如果< 1 ,则 
过程在有限代以后停止的概率为 1. 

我 们也逢 求得第》代的期望大小 E ( X 0 ) = P ；( l ). 因为 
p „0) = p ( p „_ 心））， 故我们有 p ；( i ) = P ' C ^ CO ) K - iO ) = 
pXDpU ( i ) = /^ E ( X n _ 1 ), 于是由归纳法得 

E ( X „) = fi ". (5.3) 

故可以预期后代的大小是按指数律增长的.以上的论证可加以引 
伸.易见，不仅 P „( o ) -* ^ 而且对于所有的 f < 1有 P „0) 

这意味着^ A A •… 的系数趋向于 o . 在很多代以后无后裔的 
概率接近【，后裔数超过任一预先指定的界限的概率接近1 一 f ; 
后裔数目大小适中则几乎是不可 能的乂 

6.问 题 

1. 试证明分布 （1.1) 的均值为 E ( N ) E ( X ), 方差为 E ( N ) Var ( X ) + 
Var ( N ) E »( X ). ( a ) 用母函数的方法， （ b ) 直接从定义与条件期望的概念 

来 证明. 

2•陷兽井问题[例 （ l . b )]. 如果 (>»} 为几何分布，则合成分布也是 
几何分布.如果为对数分布[参见公式 （2.4)], 则合成分布为具有附 
加项的对数分布. 

3. 在 N 次伯努利试验中（此处 N 为具有普阿松分布的随机变量)，成功 
与失败的次数是统计独立的变量.试将这个结果推广到多项 分布： （0 直接 
推广，00用多元母函数的方法.[参见第九章例 （ l . d ).] 


1) 关于 X ,的伏态可参见 [16], 
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4. 随机化.设 N 具有均值为 A 的普阿松分布，将 N 个球随机地放人》 
个盒中.不用计算证明：恰有个盒空着的概率为 

(”) [(1 — e )-""]" - ' 

5. (续上)试证明当 r (―个确定的歡)个球随机地放人》个盒中时 
恰有个盒空着的概率等于上式中 e ~^ / r ] 的系数 .（ a ) 讨论与矩母函数 
的联系(笫十一 章间题 24). ( b ) 利用这结果导出第二章的公式 (11-7). 

6- 概率分布的混合.设与 {&} 是两个概率分布，《 >0, 0 >0, 
« + ^ = 1.则+ figi } 也是概率分布.讨论它的意义及其与第五章 
第2节中的罐子模型的联系.推广到两个以上的分布的情况.复合普阿松 
分布能否为这样一个混合？ 

7 . 在分支过程中征明 Var(X B+ ,) = ftVaKX,) 十 <7* : (a) 利用母 

函数， （ b ) 利用条件期望.由此得出 Var(X„) = ^ » ( 〆 ”-*+ 〆》-* + .•• + 

8. (续上).证明当》 >m 时 E(X„X m ) = E(XJ,).. … 

9. (续上).证明 X „， X S 的二元母函数由此证明上 

题中的论断. _ 


]) 这个推导各种组合公式的巧妙方法是由 C . 多姆 （ C . Domb ) [17] 中给 出的, 
2) 原书误为又*——译者注_ 
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第十三章循环事件 • 更新方程 

1. 直观导引和例子 

我们将要研究与重复试验有关的某些能够重复出现的事件型 
样.粗路地说，以下理论中所考虑的是具有如下性质的型样 
在#每次出现以后，.试验重新从头开始，即#出现后的试验是整 
个实验的重复.接连两次 出现# 之间的等待时间是相互独立且 
具有相同分布的随机变量. 

最简单的特殊情 况是# 代表在伯努利试验序列中“出现一个 
成功”.第一次成功的等待时间具有几何 分布； 第一次成功出现 
后，试验重新从头开姶，而且在第 r 次与第 r + 1次成功之间的试 
验数具有同一几何分布.直到第 r 次成功的等待时间是 r 个独立 
变量之和[第九章例 （3.0 L 反之，设在某个团体中逐个抽查其成 
员的生曰，并令#代表‘‘样本中有两个人有相同的生日' 这里# 
并不是重 复的； 因为它一旦出现，就将永远保持下去.虽然抽样可 
以进行到第二个重复生日出现，但第二阶段的抽样并不是第一阶 
段的重复.样本越大，出现重复生日的可能性也就 越大； 故第一次 
重复生日的等待时间越长，就可能使得第一次出现重复生日和第 
二次出现重复生日的间隔缩短.这两个接连的等待时间不仅没有 
相同的分布，而且也是统计相依的.这种等待时间不是循环事件 
理论的硏究对象. 

当我们考虑伯努利试验中接连两次成功的出现时，出现一种 
不同类型的现象.型样第一次出现是容易定义的，但如果 
代表“正好只有两个成功接连出现”，则第三次试验可能取消第二 
次 试验； 例如，如果前四次试验的结果为 则# 在第二次试 
验出现，但整个序列并不包含#.对我们来说，事件在第》次 
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试验出现”仅依赖于 前 《 次试验的结果而与以后无关这一性质是 
重要的. 

V . 下面我们考虑可以应用循环事件理论的几个典型 问题. 

例 . （ a ) 伯努利试验中的成功连 术语“长为的成功连 
贯”曾用多种方法定义过.一个由接连三次成功所组成的序列是 
包含0个还是包含1个或2个长为2的连贯，这主要是随我们习 
惯和方便而定，根据不同的目的，可以采用不同的定义.然而，如果 
我们要应用循环事件的理论的话，那么长为 r 的连贯的概念必须 
这样定义，使得每当一个连贯完成后，过程又重新从头 幵始. 这就 
是说，我们要采取下面的 定义： 在》个字母与 F 的序列中所包 
含的长为的成功连贯数，就是这个序列中所包含的互不重选的、 
由恰好》•个 S 所构成的字母串的个数.在一列伯努利试验序列中， 
如 果第” 次试验的结果使得序列的连贯加一个，则我们就说一个 
长为，的连贯在第《次试验出现.因此，在 SSSlSJMSSSlSW 中 
有三个长为 3 的成功连贯，它们分别在第 H 11次试验中出现； 
有五个长为 2 的成功连贯，它们分别在第 2, 4 , 7, 9, 11 次试验出 
现.这个定义把理论大大地简化了，因为此时固定长度的成功连 
贯变成了循环 事件. 计算序列中的连贯数相当于计^其中由至少 
»•个 <5所组成的成功串的数目，不过 > 个接连出现的成功要算两 
次， 3; •个接连出现的成功要算 3 次， 等等. （在 7 、 8 两节中我们 
还将讨论这个问题 .） 

( b ) 计数器问题. 用于测量宇宙射线和 a - 质点的计数器可用 
如下的简化模型来描述 15 .设伯努利试验匀速地进行.计数器被设 
计能自动记录成功，但在每次记录以后的恰好 r 一 1次试验中它 
是关闭着的.于是一个成功被记录的充分必要条件是在它前面的 
r 一 1次试验中计数器没^•记录.计数器的输出表示一列相关试 
验的 结果; 每一个记录有一个后效.然而，每当计数器处于自由状 


1) 此处所描述的是所谓第一类计数器的离散类似.在问题10中描述了第二类计 
数器.有关讨论见 [18]. 
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态(没有关闭)时，情况完全一样，且试验重新从头开姶.设/代 
表“在试验结束时计数器处于自由状态”，则我们得到一个典型的 
循环型样(参看问题9与10及第十五章问题 13). 

(c) 返回原点. 在成功概率为？的一列伯努利试验中，令# 
代表“成功和失败的累积次数相等和以前一样，我们用具有共 
同分布 P { X ^ = 1} = P { X ^ = —1} = q 的独立随机变量 { X t } 
来描述伯努利试验，并设 

So = 0, S „ = X , + X 2 + • • • + X „. (1.1) 

于是次试验中正面比反面多出现的次数，易知，当且仅当 
s * = 0 时，#在第”次试验出现.我们称 < f 为返回原点.设已 
给 s „ = 0,则其后的部分和 * 

S。 = S B ，S; = S»+ t ，S; = S n +2, • ‘ . （1.2) 

与原来的序列 { SJ 服从同一概率关系,而且当 { SU 返回原点吋， 
{ SJ 也返回原点 3 反之亦成立， . 

事件在第》次试验第一次出现”（也叫“第一次返回原点 
发生在第》次试验”)由使得 

Si =5^ 0 , Sj # o , …， S„-i # 0， S „ = o (1.3) 
成立的序列 { Xd 的集合来定义.如果这事件发生，则我们说等待 
时间 r 等于〜并记 （1.3) 的概率为/„ = P{T = «}. {/„} 的前几 
项 f 易用直接枚举所有可能序列的方法来 计算； 显然当《为奇数 
时 ./ n ，0, A = 2pq, / 4 == 2/> V ， /« = W ， /s "= 10/» Vj im = 28 
pV . 同一序列 {/„} 也表示 # 第 r 次与第 r + 1次出现之间的等 
待时间的槪率分布，我们也称 {/ n } 为循环吋间的分布.（在第九章 
第 3 节中曾用母函数的方法求出过这个分布.在第三章中讨论了 

的特殊情況，而公式则适应于一般情况，因为满足 

( I . 3 )的结果数并不依赖于久在本章中我们给出一个新的、独立 
的推导 

( d ) 伯努利试验中的梯级点. 保持上例中的记号，我们定义 
—个新的型样“孑在第《次试验出现，如果 s „ 超过前面的所 
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有和'亦即如果 

S, >0, S„>S 13 S„> S 2 , S„> S»-1. (1.4) 

在这种情况，我们称笫"次试验（或指标 《) 为一个梯级点.在由 
—1，0, 1 2 1，2, 3 2, 1, 2, 1，2, 3, 4 5给出的部分和序列 
S 1} S„ ••- 中（参见第三章图 3 )，在第3, 4, 7, 14, 15次试验中 
出现梯级点，且接连两次出现之间的等待时间分别为夂1，3,7, 
1, 笫 r 次出现#也就是第一次出现值 『， 故梯级点可用初过时 
刻来描述. 

如果# 在第〃 次试验出现，则过程按下述意义重新从头开 
始.假定 (1.4) 成立，则其后的试验数 n + m 为梯级点的充分必 
要条件是 … 




(1.5) 


令 

S* == S rt+t — S„ = X, 1+l + * ••+ X„4*. (1-6) 

则 《 + /« 为序列 S t ,S 2> • •- 的一个梯级点的充分必要条件是 m 
为 .{ SU 的一个梯级点 • 显然 (1.6) 中所定义的运算产生原来的 
样本空间的一个独立的重复，故/可作为循环事件理论的研究对 
象.值得注意的是，在这种情况下，序列（ I . 2 )本身和原来的序列 
在槪率上并不 相同： 在/出现 r 次以后，部分和民必定接近于 
而不是 0. 然而，'就/而论，在#出现后的试验是重新从头开'始 
的. 

(梯级点提供了一种工具，用它可将初过时间的研究化归为循 
环事件，亦即化归为独立随机变量的求和.第九章第 3 节中给出 
了一个直接的 C 等价的)方法.梯级点的概念能有益地应用于任意 
随机变量的序列，例如关于一般的反正弦律 .） 

( e ) 在接连投掷一个均匀的骰子的序列中 ，令# 代表“一点， 
二点， …， 六点出现的次数相等这里忒显然具有循环的特性，而 
无需进一步解释. 
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2 .定 义 

我们考虑可能结果为 AG = 1， 2 , • • •） 的一列重复试验.并 
不要求这些实验是相互独立的(因而可以应用于马尔科夫链).和 
往常一样，我们假定在原则上试验可以无限地继续下去，而且概 
率也能够相容地对所有的有限序列给予定 
义•设#是有限序列的一个属性•，即我们假定对于毎个有限序列 
CE n , E h , • • •，£,+„)，可以唯一地确定它是否具有这个属性我 
们约定，语句“在在(有限或无限)序列 £ A ，• • • 中的第《个 
位置处出现”是子序列“尽,， E it ，…， 具有性质#”的一种简 
略的说法.根据这个约定，#在第”次试验出现仅仅依赖于前” 
次试验的结果.这就容易明白，当我们说到一个“循环事件的 
吋候，实际上我们所指的是一类由/的出现这一性质所定义的事 
件.所以很清楚，#本身与其说是一个事件，倒不如说它是描述 
某种性质的一个术语.此处我们用语不够确切，但这种情况通常 
是被允许的;例如，我们常说“一个二维问题”，而大家知道，问题本 
身是没有维度的. 

定义 1. 属性#定义一个循环事件，如果 
G ) 为使#在序列 iE u> E h , •••, E in + J 的第”个与第 
n + m 个位置处出现，其充分必要条件是/在两个子序列 ( Ey ,, 
£ 心 • • • ，和 （ E / 叫,，&„+,，•••， ^ y n + m ) 的最后出现， 

( b ) 在这种情况下，我们有 
P {〜 …， E /n+ J 

= P { E ,,， -•■, E jn } P { E in + i ,--, E tn+m }. 

S 在序列 E & • ••) 中的第 》 个位置处第一次出现之类 
的说法的意义是很显然的，此处不再赞述.又显然对于每个循环 
事件都可以定义如下两个 数列： 

«„ = P {/ 在 第”次 试验出现}， （2.1) 

/„ = 在第 ”次试 验第一次出现 }. 
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为方便起见，我们令 

/ 0 = 0 ， « 0 = 1 , ( 2 . 2 ) 

并引进母函数 

»■ S 

FO ) =念 / 〆 ， U ( s ~) = S U k s k . (2.3) 

K =\ 犮 =0 

注意， {々} 并不是概率 分布； 事实上，在某些典型情况我们有 
2 «々= 00 .然而，由于事件在第》次试验第一次出现”是互 
不相容的，故有 

卜 (2.4) 
»= 1 

显然 ，1 一/可以解释为在无限延长的试验序列中#不出现的概 
率. 如果/ = 1 ，则我们可以引入具有如下分布的随机变量: T : 

P{T = «}=/„• ( 2 . 5 ) 

当 f < 1吋，我们仍然使用 (2.5) 中的记号.在这种情况， T 是一 
个非真 正的/ 或有欠缺的)随机变量，它以概率1 _/不取任何数 
值.（当然我们也可以规定此时 r 取值 0O , 显然，对于这种情況并 
不需要新的规则 .） 

衣 的等待时间，即一直到第一次出现#的试验次数(包痞使 
得/ 出现的这次试验在内)，是一个具有分布 (2.5) 的随机 变量； 
不过这个随机变量实际上仅仅在无穷序列 CE h ， E h ，. . •) 的空间 
中才有定义 • 

根据循环事件的定义，#在第々次试验第一次出现且在第》 
次试验第二次出现这一事件的概率等于匕 . f n . K . 所以 沒在第》 
次试验第二次出现的概秦等于 

/ a 5 = Ufn-l + fifn -2 + • • . + ( 2 . 6 ) 

上式右边是 {/„} 的自褶积，故 {/ L 2) } 表示两个独立随机变量之和 
的分布，其中每个变量具有分布 （2.5). 更一般地，如果0是# 
在第”次试验中第，次出现的概率，则我们有 

没)= // n {) + + - • . + f n - yfr l \ (2.7) 

k 个简单的事实可以归纳在下面的定理之中. 
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定理. 设0表示#在第》次试验中第次出现的槪率. 
则 {0} 是，个独立随机变晕 T \ ，…， T r 之和 

T (rJ = T, + T 2 + • • • + T r (2.8) 

的概率分布，其中每个变量都具有分布（2. 5 ).换句话说，对于固 

定的 r ， 序列{把}有母函数 F4 ). ' 

特别是，由此可得 - - 

. » 
eo 

2^ r) = F r ( l ) = f . (2.9) 

' »= 1 

即 # 迟早出现 『次 的概率等于 f C 其实这个结论是可以预料到 
的).现在我们引人 

定义 2 . 如果/=1 ，则循环事件#称为常返的 1 如果7<1, 
则忒称为非常返的. ， 

对于非常竭的它出现，次以上的概率趋向于0;而对于 
常返的#，这个概率恒等于 1. 这一事实也可用如下的话来 描述： 
常返的#出现无穷多次而非常返的#仅能出现有限次的概率为 
1 . (这个陈述不仅是一种描述，而且在无限序列 • ••的 
样本空间来解释吋 3 这是一个芷式的定理 .） 

我们还需要一个定义.在伯努利试验中返回原点[例 （ l . c )] 
仅能在偶数次试验中_出现.此时 / 2 ,, +1 = 〜 +1 = 0,故母函数 fo ) 
与与其说是$的幂级数，倒不如说是？昀幂级数.此类 
似，在例 （1.0 中#仅能在第6,，12, 18,…次试验中出现.在这 
种情况，我们说#是周期的.这样的循环事件有很多烦人的性 
质•，在每个实例中情况是很明显的，伹在所有一般性定理中则都要 
提到周期性这个名义上的特殊情况. 

定义 3. 如果存在整数 A >1使得循环事件仅能在第 A , 2又， 
3又， • ••次试验中出现（即 当”不 能被； ■整 除吋《„ *=0)，则称# 
为周期的.具有上述性质的; L 中昀最大者称为忒的周期. 

最后我们注意，在无限序列 Ey • • • 的样本空间中#的 

1) 在笫一版中确定的和不确定的术语都使用过，但在应用于马尔科夫链时，现在 
的专门名词更好一些. 


• 313 r 



第， • 一 1. 次与第 r 次出现之间的试验数是一个确定的随机变量 
(可能是一个有欠缺的随机变量），它具有 T r 的概率分布.换句话 
说，我们的变量 T , 实际上是代表#接连两次出现之间的等待吋 
间.为了不涉及超出本卷范围的非离散样本空间，我们曾用分析 
方法给出过的定义，但我们希望，这不至掩盖直观质朴的概率 
背景.利用循环事件的概念可将一类比较一般的随机变量化归为 
舍立随机变量之和.反之，任一概率分布{/„}，》= 1， 2 , •• •可 
以用来定义一个循环事件.我们用下面的例子来证明这一论断. 

例. 考虑一个电灯炮、一段保险丝或另外任一种寿命有限的 
零件.当笫一个用坏了时，第二个同种新零件就立刻被换上，第二 
个用坏了时，第三个又换上去，等等.我们假定另件的寿命是仅取 
某一单位时间(一年 、一 天或一秒）的整倍数的随机变量.于是每 
一吋间单位代表一次试验，其可能结果为“更换”和“不更换”.可 
以把接连的更换看作循环事件.如果为一个新零件恰好能用” 
个吋间单位的概率，则 {/„} 为循环吋间的分布.如果另件的寿命 
必然是有限的，则 = 1,此吋循环事件是常返的.通常，事先 
能够肯定零件的寿命不能超过某定值》»，在这种情况下，母函数 
F (0 是一个次数不超过〃的多项式.在应用中，我们希望求得在 
吋刻”发生更换的概率《„，这个《„可由方程 （3.1) 来计算.此处 
我们得到一类由任意分布所定义的循环事件 ./< 1的情况 
并不排除在外，此吋1 — /可以解释为零件永远不坏的概率. 

' 3.基 本关系 

在本节中我们继续采用(2.2)-(2.4)中的记号，并且要研究 
{/„} 与 {«„} 之间的关系.根据定义，€在第 t 次试验中第一次 
出现而且又在其后 的第〃 次试验中出现的概率为在第 
n 次试验中第一次出现的概率为/„ = 因为这些情形是互不 

相容的，故我们有 

>*„ = /(«„-! + / 2 ««-2 + …卜 / 為 ， « ^ 1. (3,1) 
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我们看出，上式右边是褶积其母函数为 FO) U 0); 
上式左边是缺《»这一项的数列 {«„} ，故其母函数为 1/(0 - 1. 
于是由 （3.1) 可得 U 0) - 1 = F(0 C/0), 所以我们证明了如下 
的 


定理 1. {«„} 与 {/„} 的母函数之间有如下关系: 


1/(0 


1 

1 - For 


(3.2) 


注意.当卜| < 1时， （ 3 . 2 ) 的右边可以展开为收敛的几何 
级数 SF r 0). FXs ) 5°的系数#为忒在》次试验中第 r 次 
出现的 概率， 而方程 （ 3 . 2 ) 则等价于 

»« = /o 0 + fn } 十 .... C 3 . 3 ) 

这个式子表达了如下的显然 事实： 如果#在第《次试验出或I，则 
它在前面已出现了 0, 1，2, .，.， n - A 、 次. (显然当》*>»时妒= 
0 .) 

定理 2. #为非常.返的充要条件是 、 

CO 

u = u i ( 3 < 4 ) 

j-o 

为有限.当这条件满足时，#迟早总会出现的概率/为 

f = ( 3 . 5 ) 

U 

注意.我们可把 A 解释为一个随机变量的期望值，当■^在 
第;_次试验出现时这个随机变量的值为1,否则为 0. 是《, + 
〜+•*•+«» 是在》次试验中#出现的期望次数，故《 — 1可 
以解释为在无穷多次试验中/出现的期望次数. 

证.由于系数4是非负的，故当， — 1时 t/(0 单调增加， 
因此对于每个 W/、 

S 60 

< lim U(s) < 2 ^ w - 

»= 0 s ~* 1 n = 0 

因为当时 £/(;) —(1 _/) 一 S 而当 / = 1 时 t/G) —co , 从 
而就能推出定理. 
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下面的定理是特别重要的 15 . 虽然证明是初等的，但它对于理 
解问题的概率意义并无帮助，故我们把它放在本章的最后.（不 
过，可参看问题 1.) 

定理 3. 设 及是常 返的且不是周期的，用,《表示循环吋间 
A 的均值，即 

,« = Z /7,= 广 ⑴ ' 

(可能 /i = oo ), 则当 n -> oo 时， 

— ,« -1 

(如果平均循环时间为无穷，则 《» —0). 

定理 4. 如果/是常返的且具有周期 A >0, 则当 

— 又" _1 ， 

而当々不能被 A 整除 吋以 = 0. 

证‘.因为#具有周期八故级数 FO ) = 仅包含 J 的 
各次幂，因而 FO ' /l ) = F,0) s 其中 F.W 是具有正系数的幂级数 
且 F,(l) = 1. 由定理 3 可知 ， UM = 0 — 匕0)}， 1 的系数趋 
; 向于 / fr 1 ， 此处 

//, = F ； (l) = k^F'Cl) = X~\u. 

(显然 P 与川 或者同吋为有限或者同时为无限 .） 现在我们有 
I / O ) = [/心*)，故 （3.8) 成立. 

例. (a) 作为一个平凡的例子，令孑表示伯努利试验中的 
“成功”.于是由定义 可知〜 = P . 定理 3 所陈述的是，相继两次 
成功之间的试验期望数为厂 1 .这里 UO ) = 1 + /.<! - ^)- 1 = 
(1 -炉 ）（1 一 于是由定理1可知 f (0 = ^(i - w)- 1 ， 这 

就证明 了相继 两次成功之间的等待吋间具有几何 分布. 


(3.6) 

(3-7) 

— Voo 吋 
(3.8) 


1) 见 [19]. 这个定理是为了更好的理解柯尔莫果洛夫建立的有限马尔科夫链的遍 
历性而被猜测到并被证明的在本书笫一版出版后，钟开莱注意到，定理3实 
际上与柯尔莫果洛夫的遍历性定理等价，因而可由它 导出. 以前有很多论文研 
究各种特殊情况及其 变沖. 后来，伯拉克威尔 （ D . Blackwell ), 钟开莱、耳多 
斯和华尔夫维茨等人用不同的方法将定理3推广到连续型随机变量的情况并 
使之进一步精确化.伯拉克威尔简洁地证明： （3.7) 对均值为正的所有取整数 
值的随机变量成立(不必像本书那样，限于取正整数值的随机变量）.他的方法 
是以任意变量的梯级点的应用为基础的[参见例 （1- d )]. 见1：20] . 
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( b ) 伯努利试验中返回原点 [例 （1. C )]. 如果在第4次试验 
时，成功和失败的累积数相等，则々必须为偶辫;如令々= 2 «，则 
在这4次试验中，有《次试验的结果为成功而其它》次试验的结 
果为失败.于是就是2«次试验中成功与失败出现的次数相等 
的概率，故我们有 

«2» = ( 2 : ) pv . (3.9) 

由二项分布的正态逼近可知（也容易用史特令公式来证 明）： 

(3.10) 


(3.11) 

此处符号〜表'示两边的比趋向于 1. 

如果 I / 2 ,则4何< 1，此时级数比公比为 4 辦的 
几何级数收敛得更快.如果 f = 1/2, 则〜〜 (««)-"; 故 E 〜 
发散，但《 2 » — 0. 由上面的定理可以推出，以概率1成立 着：如 
果/> # M 累积和 s „ 只可能有有限多次等于 o . 如果$ =夺= 
1/2,则它们将经过0无限多次,但平均循环时间是无限的. 

在?的情况，上述论断在直观上是很显然的，并且也可由 
强大数定律推出.用赌博的语言来说，如果赌博对某甲有利，则他 
可以确信，在最初几次起伏以后他的净贏利将永远为正.当/> = 
疗=1/2时，上述论断在直观上则很不 明显， 而这正是在第三章第 
7节中所讨论的掷钱市的起伏问题的佯谬特征的根源. 

由上面的定理还可导出几个附加的结论.利用容易验证的公 
式 




及笫二章的二项式展开式（8.7)，由 （3.9) 可得 


(3.12) 
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VO) = Xj u 2n S 2A =*= (1 — 4p^ 2 ) - *. (3 二 13) 

« = 0 

如果 /J 与 1/2，则 《 = C 7( l ) = (1 — 4 押 )-1 = Ip — 夺卜.由 
(3.5) 我们得到如下 结论： 成功和失败的累积数迟早将要相等的 
槪率为 

/ = 1 — \p — q\. (3-14) 

(这是至少返回原点一次的槪率 .） 

由 （3.2) 可得循环吋间的母函数 

F 0 ) = 1 — (1 — Apqs 2 ) i , (3.15) 

.当沪= ? = 1/2时， * 

F 0) = 1 - (1 - 戶”， （3.16) 

由二项展开式可得 

^ /2« — 2\ 2 二^^ (3.17) 

n \ n - 1 / 

(当 ”为奇数时夂 = 0). 方.程（ 3 .1 7 )给出了投掷钱币的古典赌博 
中返回原点的循环时间的分布.（在第三章第4节中我们曾用不 
同的方法导出过这个公式.现在的方法虽然不是最初等的，但却 
是最简单的 .） 

(0 多个钱币的投掷中的相同成功数. 我们考虑独立重复地 

投掷两个钱币这一试验，每当两个钱币出现正面的累积次数相’等 
(因 Ff 5 出现反面的累积次数也相等)时，我们说/出现.显然 

-^{(：) 2 -(；) 2 -(；) 2 — (1)1 ^ 

利用第二章的 C 12.11) 及本章的 (3.10), 我们有 

“" O ’ 〜点. ' (319) 

故发散, 但 所以/.是常返的，但具有无限的平均循 
环吋间. 

更一般地 3 考虑同时投掷 『个钱 币这一试验，并令忒表示 
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所有钱市出现正面的累积数相同这一循环事件.则 


2 rn 




+ 



(3:20) 


为了估计我们注意，二项分布的最大项小于所以 


< n^^ (r ~ l) 2_ n 




(3.21) 


故当^ • > 4吋 Sa 收敛.上面我们已看到，当 r = 2吋是 
发散的 .r = 3的情况必须另外考虑/由二项分布的正态逼近可 

知，当”充分大而々在丄与丄 d 之间时，我们有 

2 2 

(~)2-> cn ' i , 此处 f 为正常数(比方说 f ). 故当 r = 3、吋， 

«„ > 2 m * ( c 3 n ~^) = 2 r , / n , (3.22) 

因而发散.换句 话说， 当且仅当 3 时，4个钱市出现正 
面的累积数相等这一循环事件及是常返的.在每种情况，平均循 
环吋间都是无限的. . 

( d ) «子.在例 ( l - e ) 中我们考虑过掷骰子时出现1点、两 
点、三点、…、六点的累积数相等这个循环事件.显然/的周期为 
6,且*^ = (6 «)l (« ! ) -6 6 -6 °.利用史特令公式容易证明， u 6 „ 与 

同阶，故收敛.因此/是非常返的.由 （3.7) 容易算出， 
一次循环的时间约为 0.022. 

( e ) 在连赏理论中的应用见第7, 8两节. 


4 .更新方程 


循环事件理论中的基本方程 （3.1) 是所谓更新方程 （4.1) 的 
一 个特殊情况，有很多问题与这个更一般的方程有关. 下 面我们 
来证明，上节中的定理，不必作很大的更动，就可适用于现在的更 
一般的情况.本节的讨论'是纯分析性的，概率解释和应用将放在 
下一节. ' 
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设 {〜} 与 {&„} 是满足条件0 < a „ < 1及匕 > 0 (ra = 0, 
1，2, •••） 的两个序列.第三个序列 {«„} 由如下的递推关系来定 
义： . 

或 «„ = .„ + (« 0 «„ + 4- ... 4- «,« 0 ) (4.1) 

{««} = { bn \ + {««}* {««}. (4.2) 

解 （4.1) .依次可得 

»o = — s 0 )» «1 = (^1 + «i«o)/(l 一《。），•••， 

故 {«„} 的存在唯一性是不成问题的.我们所关心的是当 «->co 
时彳 《„} 的状态，对于这个问题有很多著作(大多是争论性的)进行 
过 讨论. 

如果令匕= 0, a ” = /„(» = 1, 2, • • •） 以及 b a = 1, « 0 = 0, 
则方程 （4.1) 就成为（3.1)，故更新方程<4.1)是更为一般的，但 
它的性质可由方程 （3.1) 的性质导出.我们再一次引入母函数 

A { s ) — ^ a 3 s n , B (_ f ) = Ytb „ s n ， U ^ s ) = 2« B 广. (4.3) 
由于系数〜与~有界，故前面两个级数至少当 M < 1时 收敛； 
很快就可看到，第三个级数的收敛性是显然的.方程 （4.1) 现在可 
以写成 u ( j ) = b (0 + ^(0 的形式？或 



I / O ) 


50 ) 

1 — A{s) 


(4.4) 


当 B ( i ) = 1时， (4.4) 就化归为 （3.2) 的形式，但两者之间还有差 
别，即现在的未必是循环时间的分布，故 AO ) 不但可以小于 
1而且也可以大于 1. 

如果存在正整数 A > 1,使得@ h ， 〜*，叫， * • /可能不为零 
以外，所有的4都等于零，则我们~称 {«„} 为周期的.此时 ^0) 
是 W 的幂级数.具有这种性质的最大整数1称为周期. 

鱗 定理 1. 设 U } 不是周期的，而且 = 有限. 

( a ) 如果= 1，则 

此处 /*=2> fl a . (4.5) 

(特别，如果发散，则 — 0.) 

( b ) 如果2~<1，贝 It 级数 
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= 丑（1){1 一 

收敛. （ - 

( c ) 如果 S « n > 1 (包栝级数发散的情况在内 ）， 

AU ) = 1存在唯一的正根 * < 1，且此时有 

u 〜 』(怎2 x -« 

" 外) • 

其中符号〜表示两边的比趋向于 1. (由关系式 （4.7) 可知，《„ 
按几何数列增加;因为当 M < 1时 30) 是正则的，故导数^00 
为有限 .） ' 

证. （0 设〜是 {1 一 中，的系数，则由上节定理 

3可知现在 

«” = "A + Vn-A + . . . + V 0 b tt , (4.8) 

对于每个固定的々，当 (9-> 0 O 时，项 6>„_^ 卜趋向于 b j ( I . 此外， 
匕是有界的.由此可以推出，当 AT 充分大时，《„与 

«» =泛 A + Vn-ih + •. . + v n - N b N (4.9) 

之差可以任意小，且 《!»—(><)+••• + bfi )/ ( I ,而这个极限值与 
6(1)/^ 之差也可任意小，于是定理的 （ a ) 证毕. 

( b ) 第三节定理 2 的证明无需改变，仍然适用于此处的一般 
情况. 

( c ) 这里只要将 （ a ) 中的结果应用于序列 {«„*"}, 与 

即可，它们的母函数分别为 JU )， SO ) 与 £/ U )， 且它 

们之间的关系与原序列之间的关系 (4.2) 是一样的. 

为完备起见，下面我们考虑为周期序列的情况，这时 
Ms ) = Sm #为 W 的幂级数.在这种情况下，我们按足标将系 
数 “n 分成几个同余类(模为儿）：{«。， 《 i ，_ «2 A ， 《3»，.*.}，{«1， « i + l , 

«2*+1，«31+13 • • • h …， « U -1， 《3又-1，… }• 

由 （ 4 . 4 ) U 可知，系数仅依赖于％，心， …， 而不依赖 
于其足标不能被; I 整除的那些因此我们将 U 0) 与 J 0) 表 


1) 直接由 （4.1) 来看更明显一些——译者注. 
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(4.6) 
则方程. 

(4.7) 


成又个/的幂级数之和： 

J7G) = UX S ) + ^iCO + . • * + s l ~ l U a - i (^), 

5 0) = B 0 (s) + sBA) + • • • + s^Bx-iiO^ (HO) 

其中 

ee to - 

UjO') ― ^] «„ ； (_+〆 ％ BjCO = ^»^+i (4-11) 

n= 0 » = 0 

于是由 （ 4.4 )， 对于一切 / = 0 ， 1， •••，A — 1 ， 有 

吵 )= 1^)(万. （4 : 12 、 

这里所有的函数都是 J 的幂级数，因此在作变换/ = <后就可应 
用前面的定理.由此得到 

定理 2 . 在周期为; L 的情况下，序列 {«„} 是渐近周期的；如 
果 J(l) = 1，则；I个子序列 {«„»+,} 都有一个极限 

lim u n i+j = (4-13) 

n -*eo fJ, 

其中 

B,(l) = bj + b l+i b ix+i + i> 3X +, 屮 • . •• 

例.累次 平均. 设 叫，《 2 , 《 s 是三个已给正数，用接连取算 
术平均值的方法构造一个无穷数列 

1 * 1 

U 4= — Oh + + «3)，«5 = — (“ 2 + + «4) 3 ••’ 

3 3 


« n+3 = T (« fl + « B+1 + «„ +2 )„ 


(4.14) 


我们来求 {«»} 的渐近性质.更精确地说，我们将证明 

« n — ♦丄（〜+ 2« 2 + 3%). 、 （4.15) 

6 , 

不用说，此处的方法可以应用到任意的平均值上去(参见本章问题 
5及第十五章问题 15). 关键之处是，这类问題可化归为更新方 
程（4.1)，因而可从一个新的角度来阐明其性质. 

如果我们令 
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«o = o, = « 2 = a, = 女， a„ = b„ = 0 (« > 4), (4.16) 


则当 《 > 4 吋， （4.14) 与 (4.1) 是一致的.为了对一切《把 (4.14) 
化归为（4.1)，我们必须定义么=«„ = 0,并由下式来确定 b ^ h . 


hi = Ui, bj 


«2 


w l5 


th 


— —(«! + u 2 ). (4.17) 


现在由定理 1( a ) 即可得到 (4.15) 而无需进一步的计算.因为母 
函数 t /(0 是有理函数，故为了看出 (4.15) 中的极限按指数的速 
度趋近并估计两边的差，我们可将它展开为部分分式. 


5. 延迟了的循环事件 

现在我们要把循环事件的概念稍加推广.这个推广十分显 
然，除了为方便起见我们将给出有关的术语和基本方程外，其它方 
面的问题就不特别提及了. 

粗糙地说，延迟了的循环事件是指它们所涉及的试验“不是从 
头开始而是从中间出发”，因此#第一次出现的等待时间的分布 
{ bn } 不同于孑相继两次出现之间的循环时间的分布 {/„}. 在# 
出现后的试验是一个固定的样本空间的精确重复，但这个样本空 
间与原来的样本空间并非同一的.除此以外，前面的理论可以应 
用. 

由于情况很简单，我们将不进行形式上的讨论，而作如下约 
定： 如果当#第一次出现以前的各次试验不加考虑时，循环事件 
的定义仍可适用，且/第7次出现的等待时间是与以后的循环吋 
间相独立的随机变量（前者的分布可以不同于共同的循坏时间的 
分布 (/„}), 则我们称#为延迟了的循环事件. 

根据以上的定义及第3节中的结果容易计算出 /在第”次 
试验中出现的概 率〜. 但更好的方法是写出一个更新型的新方程 
并独立地进行计算. 
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忒在第 《 — 4 次试验中出现并且下一次在笫《次试验中出现 • 
的槪率为 Un-K Ik . 这些事件是互不相容的，且它们对于々=1，2, 

. •••，《 — 1的并是如下 事件： #在第 ”次试 验出现并且也在第” 

. 次试验前的某次试验中出现. 在在第 》次试验第一次出观的槪率 
'为匕，故对于有 . 

«» =+ tf n -lfl + Un-lfi + • . • + Uij n -i. ( 5 . 1 ) 

对于延迟了的事件，4 

«0 = /o = ^0 = 0 (5.2) 

是最自然的;这样就把 (5.1) 化归为更新方程_ 

{«„} = { b „} + \ u n ) * {/ „} , (5.3) 


并 且对应的母函数满足 


t /(0 


5(0 

1- F (0* 


( 5 . 4 ) 


作为上节结果的一个特殊情况，我们有 

定理. 如果#是非周期的，且 2 / n = l ( 即#是常返的)， 

'则 

«„ —»• iC^b n , (I — K. ( 5 . 5 ) 

如果/ = s/ n < 1 ( 即在是非常返的），则 

, s«» = (1 — /m (5.6) 

在周期的情况下，可以应用第4节的定理 2. 

例. （ a ) 在计数器问题 （ l . b ) 中，假定在时刻0计数器正好 
关闭了两个时间单位(也就是说，在一次记录后经淇两次试验才开 
始观察).计数至少还将关闭 f — 2个时间单位，且如果第 r — 1 
次试验的结果为失败，则计数器就在这次试验结束时成为自由的； 
否则它又将记录，因而继续 关闭* •个吋间单位，等等.由此推出 
b r -2 = q, ^2,-2 = pq, ^.v-2 == p 2 q, .... 

( b ) 更新问题. 在第 2 节的例题中，我们曾考虑过一种另件， 
其寿命是具有分布的随机变量.当一个用坏了时，就立即用 
一个新的换上去，而且过程按这种方式继续下去.设#代表“更 
换”.在第2节中我们假定，在时刻0正好安装上一个新另件.现 
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在我们假定，在时刻0,另件的年龄为彳.这时#就是一个延迟了 
的循环事件，于是我们必须计算第一次更换的等待吋间的分布 
显然^是已知另件的年龄为々的条件下另件的寿命为《+ 
々的概率.因此有 

^ , r k = U + j k+l + 1 K+2 + • •(5.7) 

r k 

在应用中，通常不但要考虑单个另件，而且也要考虑整个总 
体.设初始总体（在时刻 0) 由 iv 个另件所组成，其中年龄为々的 
恰有 h 个(显然= AO. 每个另件都引出一个逐代更替的另 
件系列，并在任意时刻《，在这个系列中以某个概率需要更换.对 
于所有 2 V 个另件的这些概率之和是在时刻《需要更换的期望数 
显然〜 满足基本方程 （5.3), 其中 

b n = 2 . (5.8) 

* = 0 r k 

于是由前面的定理可知，是收敛的. 


不仅的极限，而且在时刻《的年龄分布及其渐近性质都是 
容易计算的.设4(«)是在吋刻《年龄为々的另件的期望黎(故有 
^(0) = ^).显然有 


^(») = u„- k r k3 

如果々<»; 

(5.9) 

々(《) = 

广 k—n 

如果 n. 

我们知道，在非周期的情况下，当 

n —* oo 时, u„ — 

■> B(\)/fi = N/ 


A 故由（ 5 . 9 )可以推出 — iVQ / V . 因此，在非周期的情况 
下，存在平稳的极限年龄分布 ，即： 当 co 时，年龄为4的另件 
的期望数的极限为 Nr k /[ i , 此处 iV 是(不变的)总体的大小，户= 
2^为平均寿命(如果 ft = oo , 则总体无限地老化).基本事实 
是： 极限年龄分布不依赖于初始年龄分布而仅与死亡分布 {«„} 
有关(参见问题17与 18). 

作为一个数值例题，我们考虑由 w = 1000个另件所组成的 
总体，其初始年龄分布为％ = 500, = 320，〜= 74,〜=100, 
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= 6. 设生存概率为 八= 0.20, f 2 = 0.43, f ? = 0.17, / 4 = 0.17, 
/ 5 = 0.03( 故最大年龄为 5). 这里 C / G ) 是一个有理 函数： 


叫 ） = , 397 + 332, + 159^ + 97/ + 15/ _ 

1 — 0.20^ — 0.43i 2 — 0.17i 3 — 0.17,- 4 — 0.03 户 


(5.10) 


它能展开为部分 分式: 


UO ) = 


1250 ^ 
3(1 — s') 


972s + 

61(1 + 3^/5) 


38 ^ — 
87(1 + "5) 


78225/ + 22125^ 

5307(1 + ^ 2 /4) * 

年龄分布{^(«)} (» = 1,2, 3, •■•) 可以直接由更新方程来计 
算.表1各列给出了这些年龄分布及极限分布，它表明， {&(«)} 
在趋向其极限吋并非单调的. 


表1 



n 


0 

1 

2 

3 

4 

5 

6 

7 

oo 

(J 

500 

397 

411. 4 

4]2 

423.8 

414.3 

417.0 

416.0 

416.7 

1 

320 

400 

317.6 

329.1 : 

329.6 

339.0 

331.5 

333.6 

333.3 

2 

74 : 

148 

185 

146.9 

152.2 

152.4 

156.8 

153.3 

154.2 

3 

100 

40 

80 

100 

79.4 

82,3 

82J 

84.8 

83.3 

4 

6 

15 

6 

12 

15 

11.9 

12.3 

12.4 

12.5 


( c ) 人口问題.这个理论与更新理论类似，只是人口的多少 
是变化的，且女性的出生起着更换的作用.这个问题的新颖之处 
在于，一个母亲可能有零个、一个或多个女儿，故谱系可能绝灭或 
分支.现在我们 定义〜 为一个新生的女孩成活并在年龄为》吋 
生一个女孩的概率(对以前的子女的数目和年龄的依赖性略去不 
计).于是是女儿的期望数，故< 1 , S «» = 1, > 
1都是可能的.前面的论述，作一些明显的修改后，就可应用. 
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6. # 出现的次数 


直到现在为止，我们仅考虑了一个循环事件的笫一，第二，…， 
第 r 次出现，并把它们出现的试验数看作随机变量.通常，更自然 
的是采取相反的观点，即固定试验数《，并把在 〃次试 验中#出 
现的次数 N „ 看作一个随机变量.我们将研究当《很大吋， N „ 的 
渐近性态. 

如同在 （2.8) 中—样/设 TW 表示第 r 次出现#的试验次数. 
T w 与 N„ 的概率分布之间具有如下_显的 关系： 

P{N„ > r} = P{T W < «}. (6.1) 

我们首先考虑#为常返的且其循环吋间分布 {/ n } 具有有限 
的均值 P 与方差 ( T 2 的简单情况.因为 TW 是 r 个独立随机变量 
之和，故由中心极限定理(第十章第1节)可以断定，对于每个固定 
的 r , 当 r -> 00时，有 

此处 (POO 是正态分布函数.令《 -> OO 和， — 00,并使' 



(6 .幻 


则由（ 6 .1)与（ 6 . 2 )可得 

P{N„ > r } -* < P ( r ). (6.4) 

为了用更熟悉的形式写出 k 个关系，我们引进正则化随机变 
量 

N ?= 迅 - ^ g . (6.5) 

an xn 


不等式 N „ > r 可以写成如下形式 

N» > r ~ n ^ rX 篇 — n — 

n orn l/f2 fi~ 2/2 ar xfl 

由 (6.3) 可推出，上式右边趋向于 一心故 



( 6 . 6 ) 
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P{N* — ■*■}—*• 少 ( x ) 或 P{N* < — — 1 — $(«：)_> (6.7 j 
于是我们证明了如下的 

定理 1. 正态逼近. 如果循环事件#是^*返的，且其循坏时 
间具有有限的均值. 《 与方差 /， 则如 （ 6.2) 与 （ 6.7) 所示，第 r 次 
出现#的试验次数 T w 与前》次试验中#出现的次数 N „ 都是渐 
近正态分布的. 

注意，在 （6.7) 中，我们把中心极限定理应用到一列相依随机 
变量上去了.由关系式 （6.7) 似乎应该有 

E(N fl ) - Var(NJ ~ (6.8) 

但其正确性尚需进一步论证. . 

下一节.中我们将琿过对连贯理论的应甩来说明定理1的用 
处.不过，应当了解，在随机变量起伏理论和杨逢过程中所遇到的 
循环时间大多数都有无限的均值，因而定理1必须用更一般的定 
理来代替™. 

' 在直观上，我们总以为 E(NJ 应当随着《线性地增大[如同 
在 (6.8) 中一样]，之所以产生这种想法，是由于如下的朴素 考虑： 
“试验的次数增加一倍时，/出现的次数大体上也应增加一倍”. 
然而，事实并不如此.掷钱市中的返回原点(它是扩散理论中的循 
环时间的代表)可以再次用来说明一般起伏问题中这种意料不到 
的 性质. ) 

定理 2. 循环悖理. 设#为对称伯努利试验(例如掷钱币） 
中的返回原点.则在2»次试验中出现的期望次数 E(N 2 „) 由 
下式给出/ 

'E(N 2 „) =0 + 1)( = ) 2-一 1, . <6-9) 

所以 

E(NO 〜 20/®”. (6.10) 

(E(N„) 木 是随” 线性增加,而是按数量级^增加 .） , 

证.由第十一章公式 （ 1.8) 及本章 （ 6.1) 可得 ’ 
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£ (N„) = S P{N n = S P{T W <«}. ( 6 . 11 ) 

r=l r=l 

的母函数为 FtO , 其中 FO ) 由 （3.16) 所决定，即 FO ) = 
1 — (1 - f 2 ) 1 . 由第十一章第一节的定理1可知，累积概率 
P { T « < «} 的母函数为 F f O)(l - 于是由 C 6. ll ) 可知，序 


列 {E(N„)} 的母函数为 



SE(N„ V = 

FO) ' 


(1 - ,)(1 - F(0) 



.1 -h s, 1 

(6.12) 


Cl — s 2 )^ l — s' 

由此有 ， 

/—A\ 

1 

E(N 2 „) = E(N 2 

»+i) = (—l) n 2 — 1. 

(6：13) 


\ n 



利用第二章公式 (12.5) 就可将 （6.13) 写成 (6.9) 的形式. 

' 这个定理的奇妙含意我们曾在第三章第6节中详细讨论过. 

那节的定理2证明^ N n ‘ / T 2 具有由正态分布的正值部分给出的 
渐近分布.正则化全量 N n «- 3 与以上定理1中的正则化变量形成 
鲜明的对比. ■ ^ 


.在成功连贯理论中的应用 

在以下两节中， r 表示一个固定的正擊数，#代表在一列伯 
努利试验中长为 r 的成功连贯的出现.连贯的长度按例 （ l . a ) 中 
的规定来定义是重要的，因为，不然的话，连贯就不是循环事件，因 
而计算就会变得寅麻烦.如在 （2.1) 与 （2.2) 中一样，《„是<^ ■在 
第” 次试验中出现的概率，/„是长为 》• 的成功连贯 在第” 次试验 
中第一次出现的概率. ’ 


本节及下节讨论专门的论题，可以略去 • 
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第 n，n — l,ti — 2 , + 1 次试验(共，次)都出现 

成功的概率显然为 〆 .在这种情况下, > 在这『次试验之一中出 
现；#在第 n — \ 次球验出现（々 = 0， 1 ，.•••， r — 1) 而在其后 
的々次试验都出现成功的概率为 u n . K p \ 因 为这〃 种可能是互不 
相容的，故我们有如下的递推关系 

«,, + u n -tp + • • • + u n -,+ ip r ~ l = p r . (71) 

这个方程当时成立.显然 

«, = « 2 = • • * = w r _, = 0, « 0 = 1. (7.2) 

用/乘 （7.1) 并对 n ^= r , r + 1, r + 2,…求和.由 （7.2) 可 


知，左边的和为 


{ UO ) — 1}(1 + + pv +•••+- /- V -1 )， (7.3) 

而右边的和则为 + ， +i +•••>. 求出这两个几何级数的和， 
我们得 

{I/O) — 1} • ■ (7.4) 

1 — ps 1 — ^ 


或 


i / O ) = 


1-^4- qp r s r+i 
(1 — 0(1 — ，，）. 


(7.5) 


利用方程 (3.2), 我们得到循环吋间的母函数 
F ( f ) = ■ 叫 1 T P) = __ f 丄 


1 — s + qp r s r+l 1 — qs(^l + pi + • • • + 




(7.6) 

因为 F ( l ) = 1,故在延长的试验序列中，任意长的连贯数必. 
定无限增加.因为故平均循环时间可直接由 （7.1) 得 
到.如果还要求方差，则用的导数来求更好一些.在求 〆 (*) 
时，最好是先去 (7.6) 的分母，然后用隐函数微分法.求出 F^O 
后，再通过简单的计算就可证明，长为 r 的连贯的循环时间的均值 


1) 古典的方法在于导出/»的递推关系.这个方法要麻烦得多，因而不能应用于 
任一种连贯或像 SSFFSS 之类的 型样； 而我们的方法，无需改变，就可用来讨论 
这类问题. 
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与方差分别为 


1 — p r 2 1 2 ，‘~hl P 


(7.7) 


由上节定理 1 可知，当 》 很大吋，》次试验中所产生的 长为* •的 
连贯数 N „ 近似地服从正态分布，即对于固定的《< #， 

iL + 1 + -^L (7.8) 

^ ft- ^ 

的概率趋向于 ① Q ) — Ha ). 这个事实首先是由冯•米赛斯证 
明的，但如没有循环事件的理论，则证明需要相当冗长的计算.表 
2给出了几个典型的循环时间的平均值. 


表2 


成功连贯的平均循坏时间.假定试验以每秒一次的迪率进行. 


连贯的长度 

p = 0.6 

P = 0.5 (钱币）_ 

<- = 4 -(骰子 > 
6 

i * = 5 

30.7 秒 

1 分 

2.6 小时 

10 

6.9 分 

34.1 分 

28.0 月 

15 

1.5 小时 

18.2 小时 

18098 年 

20 

19 小时 

24.3 天 

140.7 百万年 


利用第九章第4节中的部分分式的方法可以导出一个极好的 


近似公式.容易看出， （7.6) 中第二个表示式的分母有唯一的正根 
^ = x . 对于满足 M < r 的每个实数或虚数我们有 
|^(1 + %+-•• + V _1 )| 

^ qx (\ + px + ' • • + = 1 ， (7.9) 

其中等号仅当左端的所有项具有相同的幅角（即/ = 均时 才能成 
立.故^的绝对值小于 （7.6) 的分母的任何其它根的绝对值.因 
此我们可以应用第十一章中的公式（ 4 . 5 )与（ 4 . 9 )，其中= X . 
系数 A 容易由 U ( s ) = fs r {l — ps ) 及 VO ) = 1 — f + W / +1 算 
出.利用 POO = 0 即可求得 


/ 〜 O — t)(l - px ) . 1 

+ 1 一 rx)q x n+l 


(7-10) 


• ? ；1 * 



在 》 次试验中无连贯的概率为％ = 丄 +1 + /»+ 2 + / ㈣ + • • •• 由 

(7.10) 可知，可用一个几何级数来近似％,于是我们得到 

a n -- (7.11) 

q (r + 1 — rx)q ? +l 

故在 》 次试验中不出现长为，的成功连贯的概率渐近地电 

(7.11) 给出.表 3 表明，甚至当”很小时，公式 （7.11) 给出的近 

似也极为精确，且近似程度随着》的增加而迅速改进.这表明，母 
函数和部分分式的方法是一种有力的工具. - 

表 3 


p = 4 •的 n 次试验中不出现长为 r = 2 的成功连贯的槪率 • 
2 


n 

心的精确值 

(7.11) 给出的近似 

误差 

2 

0.75 

0,76631 

0.0163 

3 

0.625 

0.61996 

0. G 080 

4 

0.500 

0.50156 

0.0016 

5 

0,40625 

(*.40577 

0.0005 


数值 计算. 为了对注童实用的读者有所裨益,我们借此机会来说明，部 
分分式展开中所牵涉的数值计算经常并不像乍一 •来那 样繁难 > 并且能得到 
极好的误差估计. 

渐近展式 （7.11) 提出两个 问题： 首先，必须估计略去的〃 一 1个根的 
影响;其次，必须求出起主要作用的根 

(7.6) 中的第一式表明， FO ) 的分母的所有根满足方程 

f = 1 + qp's '^'. (7.12) 

易知 ，/ = 厂 1 是 （ 7.12) 的一个根.对于正的 5 /0) = 1 +今 〆〆 +1 是凸 
的;它在*与 r 1 处与平分线 y = <相交，故在 * 与 r 1 之间其图形在平分线 
的下方 .’ 此外，= O + 1)?. 如果这个数大于1，则 / CO 的图形 
从下面穿过平分线，因而厂为确定起见，我们假定 

(/• + I)g > 1; (7.13) 

在这种情况下 ，工 < #> _ ‘，且当 r < ^ < P — 1 时， / C 0 < V 由此可以推出，对. 
于满足不等式 * < UI <厂 1 的所有复数6我们有 UWI < /( kl ) < M » 
故任何根〜都不可能位于环形区域 .£ < 卜1 <厂 1 中.因为 r 是绝对值最 
小的根，故对于每个根4 有. 
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k*l > P ~\ (7.14) 

通过求 （7.12) 的导数可以看出，所有根都是单根. 

< 1 . 的相应于每个根的部分与它相应于起主要作用的根*的部分 ( 7 . 11 ) 
具有相同的形式，故 C 7. ll ) 中所略去的 》■ — 1项具有如下形式 




- (~+ 1) 7^*- 


(7.15) 


我们要估计上式右边第一个分式的上界.为此我们注意> 对于固定的^ > 
P ~' > (»• + l )^ 1 有 


P^ e - 1 < 

rse id — (r 十 1 ) 、* 


+ 1 • 
;+ / 十 —I 、， 


( 7 . 16 ) 


事实上，上式左边显然当^ = 0和0 = tt 时取极值，以 D 与汉直接代人即可 
看出3 0 = 0对应于极小值，0 対应于极大值.由 （7.13) 与 （7.14) 有 


1^*! < 


2, 


< 


2p nJt 


(，+ 1 + O rq{\ + p) 


(7.17) 


于是我们得到如下结 论：在 （7-11) 中由于略去 r _ 1个不同于 r 的根而引 


起的误差的绝对值小于 


2 (r - 1 )P 
〜 （ 1 十 P) 


<7.18) 


根*容易用逐次逼近法来计算[令4= 1,*,+, =/(*,)]. 昕得出的序 
列单调收敛于 h 因而每一项都可作为 x 的一个下界，而使得/ > /(0的任 
何值 /都可 作为一个上界.容易看出， 

尤 =1 + 分 〆 + (»• + 1).U〆） , + (7.19) 


8,更一般的型样 


我们的方法可以应用于一类比连贯理论深奥得多的更为一般 
的问题. ' 

例. （ a ) 不限种类的连贯. 设#代表“一个长 r 的成功连贯 
或一个长为 P 的失败连贯这里我们所涉及的是两个循环事件 
心与其中心 代表“长为 r 的成功连贯”，代表“长为 P 的 
失败连贯”，而#则为或对应于 A 的母函数为（7.5)， 
现在我们将它记为 t / t 0). 对应于 A 的母函数可由在 (7.5) 中交 


• 333 • 



换？与 2 并用 P 代替、而得.#在第"次试验中出现的概率《„， 
除《。夕卜，是对于# 1 与的相应概率之和.由此有 

UO) =-t/ t 0) 4- U,{s) - 1. (8.1) 


于是#的循环时间的母函数 F0 ) 为 F(0 = 1 - u - Ks ') m 


F (0 = (1 — 涔） 〆 /(l— 〆〆 ） + (.1—(!s) ^(1—pV) 
} 一 l — s + qfs T+l + pq p s p 十 1 — p T q p s r ^ 


( 8 . 2 ) 


由微分法可求得平均循环时间 

Cl - /)'(! - qO m (8.3) 

qp r + P 矿 — PY 


当 p — oo 时，上式趋向于由 C 7.7) 给出的成功连贯的平均循环时 


间. 

( b ) 在第八章第1节中，我们计算过长为 》• 的成功连贯发生 
在长为 P 的失败连贯之前的概率.如例 （ a ) 中那样定义两个循环 


事 件忒与 .设&为 A 在第》次试验第一次出现且在此之前 
A 未曾出现的概率；/„为在第《次试验第一次出现的概率(对 
于不加住何限制).交换忒 i 与像定义％与 L 那样，分別 
给出％与&的定义. 

在 C 7.6) 中给出了 /„的母函数，交换 P 与穿并用 P 代替》•即 
得 GO ). 对于〜与^„，显然有如下的递推 关系： 

x„ = f„ — iyif„-i + yJn-2 + ... + , 

g n ~ iXign-i + X 2 g „-1 + * * * + ( 8 . 4 ) 

这些方程是褶积型的，故对于对应的母函数我们有 


X0) - FCO - YO)FO), 
Y ( s ) = G (0 — X ( s ) GO ). 
解这两个线性方程可得 


X (0 = 


f ⑴ {1 - GO )} 
i - F ( s ) GO ) } 


Y ( s ) = 


GQ ){1 - F ( f )} 

1 - fO) GO) 


(8.5) 

( 8 . 6 ) 


%与的表达式又可由部分分式的方法求得.当 f = 1时，我们 
得 X ( l ) = Sa = 6这就是 A 在 心之前 出现的概率.肖，=1 
时， (8.6) 第一式的分子、分母都为0，,故 x ( l ) 可由洛必大法则通 
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过求分子、分母的导数而得到 r 

X(1) = GX1)/{F ， (0 + G ， a)}. 

由 （7.7) 有 

f ’( l ) = (1 — 〆 )/《 〆 ， G ’( l ) = (1 — qO ! pq p . 

以此代入上式即得 x ( l ), 它与第八章公式 (1.3) 是一致的： 

( c ) 考虑由型样所定义的循环事件.重复第7节中 
的论述，容易求得 

/>V ~«n+ + ^ q 2 U „- 5 . (8-7) 

因为故由上式即可求出平均循环时间 fi == p -^ q- 2 + 
p~ 2 + p ~ l . 当/> = g = I / 2 吋有 p = 70,而长为6的成功连贯的 
平均循环时间为 126. 这说明，出乎意料地，在掷钱市中的成功连 
贯与具有相同长度的其它连贯之 |' g ] 有着本质的区别. 

9. 几何等待时间的记忆缺乏 

• 等待时间的几何分布有一个任何其它分布都不具备的 重要而 
有趣的性质.考虑一列伯驽利试验，并设 T 为直到第一次出现成 
功所需的试验(包括出现成功那次试验在内）的次数，设 P{T >々} 
= q \ 假定我们已知在前〃次试验中没有出现成功；则从这第％ 
次失败起一直到第一次成功的等待时间也具有同一分布{#}，且 
它与前面的失败次数相独立.换句话说，等待时间延长々的概率和 
等待的总长超过々的初始概率是相等的.如果一个原子或某个另 
件的寿命具有几何分布，则不会发生老化现象;只要原子还存在， 
它在下^次试验中衰变的概率总是一样的.实际上，放射性原子 
就具有这种性质(只是在时间连续的情况下，指数分布起着几何分 
布的作用）.反之，如果一种现象具有完全缺乏记忆(或不会老化） 
的 特点，则它的持续时间必定服从几何分布或指数分布.一个典 
型的例子是电话的会话(它常被用来作为前后不连贯和完全依赖 
于瞬时冲动的模型)，它的可能结束是一个瞬时的偶然结果，而与 
结束前会话的长短无关 .- 与此相反，如果已有5分钟没有公共汽 


， 3i5 • 



_车 经过，则它马上就要来的可能性就更大.在掷钱币吋，正面和反 
面的累积数相等在第二次试验出现的概率为 1/2. 然而，在已知 
它们不相等的条件下，再经过两次试验而出现相等的槪率仅仅是 
1/4. 这些都是有后效的例子. 

现在我们来严视地系统阐述上面的断言.假定等待时间 T 分 
别以概率内，内， P 2, 取值0, 1，2,….设 T 的分布具有如下 
性质： 在第4次试验之前等待时间尚未结束的条件下，它在第々 
次试验结束的条件概率 等于办 （即在第一次试验结束的概率)，则 
外= (1 一办)>,即 T 服从几何 分布. ' 

证.令 ' 

= Pk+v + Pk+2 + Pk+i + ... = P{T > 々 }. 

我们的条件为 T >々 一 1，其栂率为 以 - L 因此丁 =々的条件槪 
率为 p K lq k - l3 于是以上的假设可以表为，对于所有的1有 



‘ Pk 

= />0. 

(9.1) 

• 



因为 A = 

^-i 一兮々，故 




❼__ 

^ — Po. 

(9-2.) 


1 


因为 ™ 

夕 1 +户2 +… = G 

— PoYpu, 故有办= G 

一 九)々 +1 ， 


因而外=办-| —心= (1 — Po ) Vos 这就是所要证明的. 

在随机过程理论中，以上所叙述的记忆缺乏是和马尔可夫性 
质相联系的;我们将在第十五章第10节中再来讨论这个问题 •. 

. * 10 . 第 3 节定理 3 的证明 


在第 3 节中我们略去了定理3的证明.这个定理可以作为关 
于幂级数的啕贝尔 (Tauber) 定理的一个特例，也可用如下的初 
等方法来证明.设是一已给数列，其中 /o = 0, 


初次阅读时，本节可以略去. 
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S/» = 1 , 且 使得九 > 0 的那些 《 的最大公约数为 1 . 设〜 =1 ， 
当《 > 1 时 /«„ 由下式定义 

»„ = fl»n-l + / 2 «„-2 + ... + /„« 0 ， （ 10.1) 

则 《„ 一 \/II ，此处 /« = S»/« (如果 'Etnfn 发散，则 》n -* 0). 

证.令- 

r n = fn+l + /»42 + * * - J (10.2) 

则由第十一章公式 （1.8) 有 ' 

‘《 = （ 10-3) 

由 （10.2) 可得 ~ = 1 _， fi = r 0 — r ^, f 2 = rx — r 2 , 等等. 以这些 ' 
值代 (10.1), 我们得 ’ 

r 0 u „ + r^-i + •. * + r „ u 0 = r + 6«„_ 2 + •. • + 

如果用么表示上式的左边，则上式的右边为 h , 而由这个等式 
可知，所 有的尤 都是相等的.因为 ^ = r 0 «o = l , 故对一切》有 
A n = 1. 于是对 每个” 我们有 

r 0 « a + r y u n - x + • * • + r a u a = 1. (10.4) 

由 （10.1) 用归纳法可以推出 《„<1. 故存在数 A = li mS up «„ 
使得对于任意的 e > 0及所有充分大的》有《„ < A + *，且存在 
某个序列〜，％， . • •，使得〜„ —趴选取正整数/， 使得 f , > 
0 . 我们要证明 - 如果不然，则可以找到任意大的足标 
«,使下面两式同时 成立： . 

u n >l — e, u n -j< ^ <X . (10.5) 

现在设〜充分大，使得 r N < 心 因为 u K < 1 } 故由（10*；1)，当 
fl > iV 时有 

«„</««„ + + ... + + 6. (10.6) 
当》 •充 分大时，上式右边的每个％都小于 A + e , 且 u a -i < X \ 
故有 

» B < (/o t - /i + * •" + fi-i + /；+i + •.. + / W )(A + e) 

十 /; 又’ + e^(l — /,) (又 +£) + /〆 + 6 
< A + 2e — /,(又一 O. (10.7) 

如果我们取 e 充分小，使得— ； /) > 3^则这个不等式与 
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(10.5) 中的第一个不等式矛盾，故 A' < A 的假设是不可能的. 

这就证明了，如果\ h 则 -> A . 重复以上论证，我 

们有:.如果> 0且《„„ —*• A = lim sup »„，则也有 

“tifj—i 一 ★ 又 3 2/ 一 ★ 又 s ^n v —ij 一 ★ 又 3 ^ • 

为简单起见，我们首先考虑 A > 0的情况.于是我们可取 
；'==!, 并推出，对于每个固定的々有. — 夂在 （10.4) 中令 
n — n v 可得 

1 > r 0 u„ v + r + ... + r N u„ v - N . (10.8) 

对于固定的乂每个 — A ， 故_ 

1 > l { r 0 +，！+••• + r N ). ' 

因为 JV 是任意的，故有1>4或 X < l // x . 于是，如果 （10.3) 发 
散，则有《» — 0.，故定理得证. 

如果 A < 00:，则令 ，= lim inf 用同样的方法可以证明， 

对于每个序列如果、 — r , 则 M„ u - k — 丫 也成立.如果^足 
够大，使得〜< e , 则由 （10.4) 有 

1 < ，。《«„ + * •• + r N u n - N + S ； (10.9) 

因为《 — r ， 故 . 1 < (，a + • • • + r N )r + E , 因此 fiy ^ I . 
然而，根据定义，，所以 r =^ = l / V 证毕. 

现在讨论 A = 0的情况.考虑使 h > 0的所有整数/的集 
合.在它们中间能找到一个其最大公约数为1的有限集~ ^ 
…， m . 我们知道，当时，对于每个固定的 r >0 ，y > 0, 
…， W > 0,也有 A ， A , 等等;因此 也有、 

^ n v ^- xa ~ yb—"—-wm . > 

换句话说，如果整数々能表成 h . — xa + yb + ••- + wrn 的形式 
(其中 x , y ,... > w 为正整数)，则 u n - k -^ l . 由初等数论可知， 
每个大于乘积 « bc … m 的整数都能写成这种形式.这意味着，对 
于々 > abc...m 我们有 u„ v - k -> A. 在 (10.4) 中令 n = n „ + abc 
•••；» 就可以得到 （ 10.8). 证明的其余部分无需改变. 


• .? ? 8 • 



11 .问 题 


1- 设为一多项式.用第十一章第4节中的部分分式方法证明，在 
这种情况第3节中的所有定理成立. 

2- 重复掷 r 个钱币，设#表示如下的循环 事件： 对于>•个钱币中的毎 
—个出现的正面和反面的累积数相等. d 是常返的还是非常返的？对于使 
S 为非常返的最小~估计^迟早要出现的概率. 

3•设 { X *> 为一列相互独立的随机变量，它们具有共同的分布 p { x * = 
«> = */(« + b ), P { X *= - b ) = ♦ + 6)，其中 fl 与 6 为正整数.设， 
表示事件 s „ = o . 证明#是常返事件. 

4 . 设 { M 是任意一列独•立同分布的随机变量，又设'代表 S , = 0, 
Si < 0 , s, < 0, •• • J s^, < 0 ,证明除 p{** == 0 } = 1 这个特殊情况外， 
#是一个非常返的循环事件. 

5. 累次平均 . 将第4节中的例子推广到加权平均值上去，并求出极限. 

注意 . 问题 6— 8 参照 P = ^ = 1/2 的伯努利试验(掷钱币）. '假定返 

回原点的母函数 Ks ) = 1 - (1 - ^) ，/2 是已知的. 

6- 设 A 为循环事件 S , = 0, .求循环吋间的母函数. 

7- (续上 )• 求梯级点（例 〖 . d ) 的循环吋间的母函数，（注意.这与第 
十一章第3节中所讨论的初过1的等待时间是一样的 .） 

8. (续上).证明 定理： S * 在第 2 »或第2» + 1次试验中取到它以前 
所未曾取到过的值(即出现一个初过)的概率等于 s „ = 0的概率. 

9. - 在计数器问题 （ l . b ) 中： （ a ) 求循环时间的母函数.（其物理意义是 
什么？ ）（ b ) 如果 z , 为前 次试验中的记录数，求 E ( Z S ) 与 v ar ( Z .). 

10. 第二类计数器与例 （ I . b ) 中的计数器不同之处在于，每次成功使计 
数器关闭个时间单位（出现成功后的》 ■— I 次试验),且关闭期间内的成功 
会使关闭的时间延长.对这种计数器解问题 9 . 

11. 求在钱币的 10.000 次投掷中长为3的正面连贯数在700与730之 
间的概率的近似值. 

12. 在掷 芦币的 序列中，设/代表型样 HTH , &为#在第《次试验中 
不出现的概率 i 求母函数,#用部分分式的方法求出渐近展式. 

13. 证明在例 （ S . b ) 中赌博的持续时间的期望值为 
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其中 P , 与分別为长为”的成功连贯与长为^的失败连贯的平均循环吋 
间 ..' 

14. 设每次试验的可能结果为 B , C ; 对应的概率为 《， jS ， V (« +卢 
+ ” = 1 ). 求在》次试验中不出现如下的长为^的连贯的概率的母函 数：' 

^的连贯， （ b ) ^或 B 的连贯. （ c ) 任一种连贯. 

15. ' (续上).求第一个长为 r 的连贯在第 n 次试验中出现 且在此 之 
前未曾出现过长为 P 的 B - 连贯的概率. I 注意，这个问 翹不能 化归为当 P = 
a/{a + |3), 9 = /3 /(a + ( 8 ) 时的例 （ 8 . b ) 中的问题 .] 

注意.下面的问题参照更新理论，特别是例 （ 5 . b )， 

16. 总体大小的不变性.对于（？.9).中的量，用归纳法证明对于每个》 

/ 

有2 〃*( n ) = w . 

A 

17. 设死亡分布为 p k = < i A -' f>(p + <? - 1) 3 且初姶总体由 W 个年龄为 
0 的元素组成，求《> ■及极 限年龄分布. 

18. 如果 〃*(«) 不依赖于 B ， 则称年龄分布是平稳的.证明当 且仅当 
〃* = Cr *( C 为常数)时，年龄分布是平稳的. 


19.设#为常返的非周期循环事件.假定循环时间具有有限的平均值 


^ 和方差⑺ . 令和 = /»+!+ /»+2 + 

H •及％ = ?»+1 + t } n +i + 

•••, 证明 

母函数 2(0 与 ^(0 当… 1 时收敛. 

证明' 


斗-士 )■ 

.n 一 吖0 
抑 (0 ’ 

( li . i ) 

因而证明 



s ( M - _ 去) = 

<7* — + 〆 

(11.2) 

2 〆 • 


20.设 《 r 为常返循环事件，队为在次试验中#出现的次数.证明 
、 E ( N ,) =«, + ••_+«■, 因而 

E ( N r ) 〜；. （11.3) 


21. (续上).证明 

T 1 

E(NJ) = + *. • + « f + 2 十 ••• + 

t ~ i 

因而 E(N ?) 是 
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戸⑺ + F (0 
(1 -0{1 


(11-4) 


中/的系数.（注 意： 这也可以更巧妙地重新用二元母函数来表达 .） 

22.设 </*,» = P { N * = »}. 证明 《■*.» 是 

卩⑺ ( L - F ^ f )> 


中，的系数.证明 E ( N ,) 与 E ( NJ ) 分別为 

HQ 


(1 -0(1 - H 0> 

与 （11.4) 中 〆 的系数. 

23. 使用问题6中的记号，证明 


Hs ) 


(1 -0{1 - p (0> 


十 


(11.5) 


( 11 . 6 ) 


R (0 


- 0 ! P {1 — 


(11.7) 

因此由上 一个 问题可以推出 

卜 4± + f - 二" , … ,， (11.8) 

其中 s , —0. 

24. (续上 )， 用类似的方法证明 

E ( N ；)^ r . :—+ 2) [ r ■+ 1 j + 2J， + (11.9) 

其中％ 为有界.因此， 

Var(N r ) — — T r # (11.10) 


25. 在一列伯努利试验中，令办表示在々次试验中恰有/ * 个长为 r 的 
成功连贯出血的槪率：利用问题2 2 证明母函数2*卜）是 
__ 1 - 〆 ， _ 

I 一 f 十 y〆〆* 1 一 （1 一 ps)p r s f x 


中 J 的系数.而且证明，分母的绝对值最小的拫为 h 二1 + gp r {\ - X ). 

26. (续 上). 长连贯的普阿松分布 n .如果试验数 A 与连贯 长度* •两者 
都趋向于无穷，且使得 ㈣ — 、 则恰有》个长为，的连贯的概率趋向于 

广 1 又 ■/”！. 

提示： 利用前面的问題，证明母函数渐近地为 
.利用第十一章第6节中的连续性定理， 


1) 这个定理是冯•米赛斯证明的,但现在的方法要简单得多. 
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第 + 四章随机徘徊与输光问题 

1.一般讨论 

本章第一部分讨论伯努利试验，为使叙述生动，我们再次使用 
赌博和随机徘洄的形象语言. . 

考虑在每次试验中分别以概率 P 与？赢一元或输一元的赌 
徒.设他的初始赌本为对手的初始赌本为 a — 故联合赌本 
为 a . 赌博一直进行到赌徒的赌本减少到0或增加到 * 为止，也 
就是说，进行到两赌徒有一个输光为止，我们所关心的是赌徒输光 
的概率及赌博持续时间的概率分布.这就是古典输光问题. 

物理中的种种应用与模拟促使我们采用变点或“质点”在*轴 
上 的运动这种更加易于掌握的解释.在吋刻0质点位于初姶位置 
在每一时刻1，2, 3, …， 如果对应的试验结果为成功，则它沿 
x 轴的正向移动一个单 位步; 如果试验的结果为失败，则它沿*轴 
的负向移动一个单位步.质点在时刻 ”的位 置表示 在第” 次试验 
结束时赌徒的赌本.当质点第一次到达0或《时试验结束.我们 
称质点的这种运动为在0与《处具有吸引壁的随机徘徊.这种随 
机徘徊被狠制在1，2 , … ， a — 1等可能 位置； 如果设有吸收壁， 
则称随机徘徊是自由的.物理学家用随机徘徊作为一维扩散或布 
朗运动的一个粗糙的近似，其中物理质点由于受到大量分子的碰 
撞而产生随机运动.?的情況对应于右向趋向，这吋质点受 
到来自左方的冲击的可能性较大;如果 P == 9 = 1/2,则称随机徘 
徊为对称的. 

在 a -> oo 的极限情况，我们得到在半无限直线上的随机徘 
徊.质点从 z > 0出发作随机徘徊，直到它第一次达到原点时为 
止..在问题的这种陈述中，我们可以看出 3 这是一个初过吋间的问 
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题; 在第三章中我们曾给出它的初等解法(-至少就对称的情况），在 
第 H 章第3节中又利用母函数的工具给出了它的另一种解法 
(又见第十三章问题 7). 我们将看到，本章中有些公式是以前曾 
得到过的，不过，现在的推导方法是新的 1 \ 

在本章中我们将使用差分方程的方法，这个方法可作为扩散 
理论的微分方程的一个导引.这种模拟自然地导致古典输光问题 
的各种修改和推广，一个典型的、富有教益的例子是用反射壁和弹 
性壁来代替吸收壁.为了描述反射壁，考虑在区间 （0, «) 中的一 
个随机徘徊，除作如下修改外，它的定义和前面 一样： 当质点位于 
点1时，它以概率1运动到位置2,而以概率4留在 1. 用赌博的. 
话来说，这对应于这样一种规考：当赌徒输掉他最后的一元吋，他 • 
的对手慷慨地把这一元还给他，因而赌博可以继续下去.物理学 
家想像在 x 轴的点1/2处有具有如下性质的一面墙：由1向0运 
动的质点都被墙反射，故质点回到1 而不 能到达 0. 吸收壁和反射 
壁都是所谓弹性壁的特殊情况.我们用如下规则来定义在原点处 . 
的弹 性壁： 质点从位置1以概率运动到2;以概率匆停留在 t 
处•，以概率 （1 一 5) g 运动到0而被吸收(即过程结束）. 当3 = 0 
时我们就得到古典输$问题或吸收壁，当 S = 1吋则得到反射壁厂 
当5由0变到1时我 d 就得到一系列中间情况 . 3越大，过程持 
续下去的可能性就越大，如果有两个反射壁，则过程永远不会结 
束. ' 

在第2、3两节中我们将给出古典输光问题及其推论的初等讨 
论.其后三节的内容比较专门(因而可以略 去）； 在第4、5两节中 
我们导出相关母函数并由此导出赌博持续时间分布的明显表达 
式，等等.第6节讨论随机徘徊取极限化为扩散过程的槪要(圹散 
方程的形式解是随机徘徊的极限分布乂 

在第7节中又回到初等的讨论，其内容是二维或多维随机徘 
徊，在这一节中将遇到新的现象.第8节讨论一种全然不同的推 

1) 反之，有些新结果也能用第三章的方法来诋明.输光问题的利用无限多次反射 
的解法见问题 7-9 f 
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广，即一种一维随机徘徊，其中质点不再限于每次移动一个单位 
步，而是可以跳跃地改变其位置，因此每次可以移动单位长度的任 
意倍.这种广义的随机徘徊与瓦尔德的序贯抽样之间的关系已受 
到普遍的注意。 

最后，必须强调指出，每个随机徘徊都表示一个特殊的马尔科 
夫链，故本章可部分地作为下章的一个导引，有几个 随机徘 徊的问 
题(例如弹性壁)将在下章重新论述. 

最后一节（问题)中包含有正文部分的必不可少的补充以及其 
它方法的槪要.我们希望，所用的各种方法的比较将表明是极有 
教益的.（读者在查阅第三章的正文和图形时要设想吋间轴是水 
平的，*轴则与之垂直 .） 

2. 古典输光问题 

/ 

在本节中我们将考虑本章开头所陈述的问题.设 I 为赌徒 
最终 11 输光的槪率， h 为他获胜的概率 .. 用随机徘徊的术语 来说， 
与 分别为从 2 出发的质点将在0处与《处被吸收的概率. 
我们将证明 = U 故我们不必考虑赌博永不终止的可能 

性. 

在第一次试验后，赌徒的资本为》 — 1或 z + 1,故:如果1 < 
z < a 一 1，则我们必定有 

= + ( 2 . 1 ). 

如果 z = 1，则第一次试验就有可能输光^故此时须用奶=+ 
?来代替 （2.1). 与此类似，如果2 = 0—1，则第一次试验就有 
可能获胜，故％ — 为把这叁方程统一起来，我们定义 

q a = q a = 0 . ( 2 . 2 ) 


1) 严格地说，输光的概率是在无限延长的赌博的样本空间定义的，但我们能在《 
次试验的样本空间中来讨论.在"次试验之前输光的概率随着"增加，因而其 
极限存在.我们称此极限为“输光 概率' 本章中的所有概率都可以用这种方法 
来解释，而不必参照无限样本空间(参看笫八章引 言）. 
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有了这个约定后，对于一切2 == 1，2, •••，《 — ■!，输光槪率都满 
足 (2.1). 

方程 (2.1) 是一差分方程， （2.2) 则表示 关于心 的边界条件. 
我们将用特解法导出 I 的明显表达式，这种方法也可在更一般的 
情况使用. 

首先假定 P ^ q . 容易证明，'差分方程 （2.1) 有两个特解 q ,= 
1及 ？ S =(?//0 S . 由此可知，对于任意常数/与 S ， 序列 

，- qg ^ A + B (±y 


表示 （2.1) 的形式解.边界条件 （2.2) 成立的充要条件是 <4, B 满 
足两个线性方程 Z + S = 1及/ + B { q/pY = 0.于是 


t = 



iq/pY — 1 


(2.4) 


是差分方程 （2.1) 满足边界条件（2_2)的一个形式解.要证明 

(2.4) 确是所求的输光概 g 只需证明解的唯一性，即 （2.1) 的所 
有解都具有 （2.3) 的形式.易知，对于已给 （2.1) 的一个任意解， 
可以选择两个常数4与 B ，使得当1 = 0及 sr = 1时， (2.3) 与这 
个解一致.从这两个解出发，依次以 z = 1, 2, 3, •…:代入 （2.1) 
即可求得所有其它值.故如果两个解当 z = 0与 Z = 1时一致, 
则它们必定恒等，因而每个解都具有 (23) 的形式. 

当 p = g = 1/2时，以上的论证不再成立，这是因为，在这种 
情况下，两个形式特解 A = 1及 I = iqlpY 恒等，故此吋 (2-4) 
没有意义.然而，当 P == ? = 1/2时，我们有第二个解 A = «.故 
q x -A + 是 （2.1) 的依赖于两个常数的解.为了满鱼边界条 
件，我们必须令 Z = 1及2 +以= 0. 因此 



(2.5) 


(形式上，在 （2.4 f 中令 p — 1/2, 并用洛必大法则求极限，也可得 
出同 一数值 .） 

于是我们证明了如下 结论： 所求的赌徒的输光概率 ，当 
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时由 （ 2 . 4 ) 給出，当 f 7 = 1/2时由 （15) 给出.赌徒获胜的概 
率等于其对手的输光概率,故可由分别用 q , P , a- Z 来代替以上 
公式中的 P ， 4 1 ， I 3 而 得到. 如前所述，容易看出 ， h = 1. 

我们将所得结果改述 如下： 设赌徒甲的初始赌本为〜其对 
手则具有无限的赌年,且赌徒甲有权随意停止赌博，而其对手则愿 
意 ，直赌 下去.赌4甲采取如下策略：当他输光全部赌本或使赌 
本增至 a 时（净贏® — ») 就停止赌博•则心是他输光的槪率，而 
\-q z 则为他获胜的概率. 

在采取这种策略的情况下，赌徒的最终赢利或损失是分別以 
概率1 — q z 与 q z 取值 fl —_ z 与 一 z 的一个随机变量 G . 期望贏 
利为 

E(G) = o(l 一 q^) (2.6) 

显然，当且仅当 p = ? 时， E(G) = o. 这意味着，在采用上述策 
略时，“公平”赌博仍然是公平的，而且也不能将“不公平的”赌博改 
变为“公平”赌博 • 

由 (2.5) 可以看到，在 p = q 的情况，一个初始赌本为 z = 999 
的赌徒，在他输光赌本以前贏得一元的概率为 999/1000. 如果 
q = 0.6, p = 0.4, 则赌博确是木公平的，但由 C '2.4) 0 可知，在输 
光赌本以前贏得一元的概率仍然约为2/彡.一般地说，如果赌徒 
的初始赌本很大(相对而言),则在他输光以前赢得少量金额 a 一 * 
的可能性很大 2> . 一 

现在我们来研究改变赌痒的 影响. 将单位由一元改为半元是 
与将初始赌本加倍等价的.对应的输考概率 W 可由在（ 2 . 4 * * * )中用 
2; s 代替 s ， 用2«»代替 a 而得 


1) 原书直接称 （2.4) 为输光赌本以前贏得一元的概率是不对的——译者注 • 

2) 某人过去毎年都去蒙特卡罗（摩纳哥首都，以赌博著名——译者注 •） 赌博，而 

且总是贏回他假期的花费.因此他坚信必有一种超机遇的魔力存在 • 其实他的 

经验并不值得奇怪.假定他所带的赌本是最终贏利的十倍，则毎年他赌羸的机 

会约为9/10 ( 根据 （2.5), 这个概率的精确值为 '10/11. 因此连贏+—次的 

概率亦为 （1 一 1/ I 1) 11 一一译者注 .） 于是接连赌贏十次的槪率为（1_ 

1/10)'° SS 0.37. 因此接连赌贏决不是不可能的. 
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q*z 


(.q/py a — {q/py 
iq/py a - 1 


{q/py + jq/py 


iZX) 


iq/py + 1 

当 q > p 时上式右端的分式大于1，故< > 我们将这个结论 
改述 如下： 如果赌注'加倍而初始赌本不变，则输光概率对于成功 
槪率 f < 1/2的赌徒来说是减少的，而对于他的对手 C 赌博对他有 


利)来说则是增加的.例如，设赌徒甲有赌本90元，其对手乙有 
1及元，而 p = 0.45, 因而赌博对甲不利.如果每次试验的赌注为 
一元，则表1表明，甲输光的概率约为 0.866. 在同一赌博中，如果 


表1输光问题的举例说明 


P 

Q 

X 

a 

概 

率、. 

期望值 

输光 

获胜 

贏利 

持续时间 


0.5 

9 

10 

0.1 

0.9 

0 

9 

0.5 

0.5 . 

90 

100 

0.1 

0.9 

0 

900 

0.5 

0.5 

900 

1000 

0.1 

0.9 

0 

90000 

0.5 

0.5 

950 

1000 

0,05 

0.95 

0 

47500 

0.5 

0,5 

8000 

10000 

0.2 

0.8 

0 

16000000 

0.45 

0.55 

9 

10 

0,210 

0.790 

-1.1 

11 

0.45 

0.55 

90 

100 

0.866 

0.134 

-76.6 

765,6 

0.45 

0.55 

99 

100 

0.182 

0. BI 8 

-17.2 

171.8 

0.4 

0,6 

90 

100 

0.983 

0.017 

-88.3 

441.3 

0.4 

0,6 

99 

100 

0.333 

0.667 

-32.3 

161J 


初始赌本为*.当赌本输光(损失 * 元)或増至《 C 贏得元)时赌博结束. 


赌注改为10元，则甲输光的概率下降到原概率 P 1/4以下，即约 
为 0.210. 可见，增加赌注的影响比我们的预料 f 为显著.一般地 
说，如果每次试验的赌注为4元，则在 （2.4) 中用 sA 代替 Z ，用 
a / k 代替“即可求得输光概率;这个概率随着4的增加而减少.故 
在赌注不变的赌博中，赌徒可以适当选择与他打算赢得事先确定 
的金额的目标相一致的大赌注，以使其输光概率减到最小.这个 
结论的实际有效性，通常受到那些坚持认为每种“不公平的”赌博 
都是不合理的人的责难.如果情况真是如他们所认为的那样，保 
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险事业就不可能存在，因为参加保险的谨慎司机显然在进行一场 
“不公平的 u 赌博.实际上，概率论中并没有什么定理会阻止这样 
—个司机参加保险. 


3. 赌博持续时间的期望值 


赌博持续时间的概率分布将在下节中导出，不过，它的期望 
值可用简单得多的方法导出，这种方法具有广泛的应用，故我们现 
在对它加以说明，而不惜稍有算复. 

我们仍然考虑本章开头所表述的问题.我们假定赌博持续时 
间具有有限期望值这一事实是巳知的.其严格证明将在下节中给 
出. 

如果第一次试验的结果为成功，则赌博就像初始位置在 s + 
1处那样继续下去.故在笫一次试验出现成功的假定下持续吋间 
的条件期望为+ 1. 这表明，期望持续时间 D ， 满足如下差 
分方程 

= />D Z+I +- ^D,_, + 1 ，0 <. z < a , (3.1) 

其边界条件为 

D 0 = 0, D s = 0 . (3.2) 

由于出现有常数项 1, 故差分方程 （3.1) 是非齐次的.如果 
p # &则 D , = r /(? — P ) 为 （3.1) 的形式解. (3.1) 的任何两个 
解之差满足齐次方程4 = pA z+l + qA …又我们已知这个方程 
的所有解具有 J + Biq/pY 的形式.由此可知，当 P ？吋， （3.1) 
的所有解具有如下形式 


D 籯 3=3 

?- 

t —^+A + B (~y . 

(3.3) 

边界条件 0.2) 要求 J + 
P ). 解出弋 S ， 我们得 

B = 0及 J + Biq/pY = 

一 a/Cq — 

£>,= -^― 

a i — {<j/py 

(3.4) 

分 ― P 

q — P l — iqlpy 
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当 夕 = ? = i / 2 吋，这个方法也不适用.在这种情况，我们必须用 
(3.1) 的一个解 一 /来代替一 /0. 由此可知，当声=夺= 

I / 2 时， (3.1) 的所有解都具有- z ^ + A + Bz 的形式.所 

需的满足迈界条件 (3.2) 的解为 

D : = z(a — 2). (3.5) 

在古典输光问题中赌博持续吋间的期望值，按 
q = 1/2,分別由 （3.4) 或 (3.5) 给出. 

应当指出，这个持续时间比我们所料想的要长得多，设两个 
各有赌本 500 元的赌徒进行掷钱市的赌博，直到有一个输光为止, 
则平均持续时间为 250000 次试验.如果一个赌徒仅有赌本一元， 
而其对韦有赌本1000元，则平均持续时间为1000次试验.进一 
步的例子可在表1中找到. 

当 a-*co 时的极限. 如果在输光概率的表达式中令 a-*oo, 则我们得到 


( 3 . 6 ) 


1， 如果 

- - > 

u / py ， ，如果 

没有人会犹豫把这些极限解释为在和具有无限赌本的对手进行赌博时的输 


光概率，但在公理方面，半无限区间 （0, 00) 上的随机徘徊应当从概念本身 
来考虑.在这种随机徘徊中，从* > 0出发的一个质点到达原点，与在自由 
随机 徘徊^ •个质点到达距其出发点 * 单位的左侧一位置的意义是一样的, 
故其槪率桓奪.这个概率我们已在第十一章第3节中算出，它与 （3.5) 是一 


致的：在和具有无限赌本的对手进行赌博时，输光的槪率，当9 P 时为1, 
当<? < P 时为在笫二种情况，谈论赌博持续时间的期望值是没有 


意义的，因为赌博可以永远迷续下去.当€ > P 时赌博持续时间的期望值为 
极限 * O — P )~', 当9 = P 时这个极限是无限的.这与我们以前得到的关 
于对称随机徘徊的所有初过时间都具有无限期望值的结果是一致的.（这些 
结果的独立推导将在下节中给出 J 


赌博持续时间及初过时间的母函数 

我们将用母函数的方法来研究古典输光问题（即在0与“处 


本节及与此有关的第 5 节在初次阅读时可以略去. 
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具有吸收壁的受约束随机徘徊）中的赌博持续时间.设初始位置 
为=(0<；^< fl ). 令表示过程于第 ”步在 吸收壁0处结束 
C 即赌徒输光)的概率.第一步后的位置为2 + 1或《 — 1., 故当 
\ <z < a - 时我们有 

♦ 

= P»z+l,n + <I«z-Un. 、 （ 4- 1 ) 

这是类似于 （2.1) 的差分方程，但它依赖于两个 i 数 r 与《.和第 
2节类似，我们要定义边界值及 《 s , 9 , 使得当«-=1, 
z = a — 1及》= 0时 （4.1) 也成立.为此 衾:们 令 

= tt a ,„ = 0 (» > 1) (4.2) 

及 

«0.0 = 1 > Uz,o = 0 (z > 0). (4-3) 

于是 (4.1) 对于所有满足0 < * < a 的^及所有的 n > 0成立. 
现在我们引入母函数 

«0 

UXs) = 2 u z.n〆. 一 ( 4 - 4 ) 

” = 0 

以， +1 乘上式两边并对» = 0, 1, 2, 求和，我们得 

VXO = psUz+M + gsUz - iO ), 0 < Z < a, (4.5) 
又由方程 （4.2) 与 （4.3) 可得出边界条件 .. 

U 0 O ) = 1， u a ( s ) = 0. (4.6) 

方程 （4.5) 是类似于 （2.1) 的差分方程，边界条件 （4.6) 则 
对应于 （2.2 义现在出现的新情况是，方程中的系数与未知函数 
都依赖于6但就差分方程而论， •^仅 仅是一个任意常数. 
如果我们能求得 （4.5) 的两个特解，则可以再次应用第2节中的 
方法.自然我们会考虑是否有形如 U z = A *0) 的两个解.以此 
式代人 (4.5) 可知， AG ) 必须满足二次方程 

又 ( j ) = psl 2 ( s ^) -1- qs , (4.7) 

其根巧 . 

2 ps 
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kO ) -丄 u ㈤ i. 

2扣 


(4.8) 


(萁由且平方 根取芷 值). 

我们已经求出 (4.5) 的两个特解，于是可以断定(像第 2 节中 
那样)，对于任意的函数 ^(0 与 BQ ), 

17,(0 = 4- B ( s ) i !(0 (4.9) 

是 (4.5) 的一个解.为了使 (4.9) 满足边界条件 (4.6), 我们必须 
有 A O ') + B (, s ~) = 1 R + BCs ) H 0) = 0 ,或 ' 

对 (0^0) — ^(^)^0) • 

版 S ) —又 1(0 


比0) 


(4.10) 


利用显然的关系 U 0 L 0) = 

U.0) - (j) x 


qlf , 上式可以简化为 

儿; 0)- 又; 0)' 


(4.11) 


这就是所求的在第《次试验输光.（在0处被吸收）的概率的母函 
数.分别用与《 — 2代替 />， w z 便得到对应的在“处被吸 
收的概率的母函数._显然，赌博持续时间的母函数是这'两个母函 
数之和. 

a -= 0°的情况 

我们的方法对于 a = 00的情况同样适用，这种情况对应于汉 
在原点处有一吸收壁的（0, oo ) 上的随机徘徊(或与具有无限赌本 、 
的对手进行赌博）.现在我们仅有一个边界条件％(>) = 1. (4-5) 

的所有解都具有 (4.9) 的形式，但因为当0 < ：« < 1时 Ui ) > 1 
而又心）< 1，故只有当 Aii ) = 0吋， U z O ) 才能有界.于是舸求 
的解为 

' F ,( j ) =以 J ). • (4.12) ■ 

这是从2 > 0出发的质点恰于第《次试验在原点被吸收的概率的 


母函数. 


换句话说，在自由随机徘徊中， （4.12) 是初过位于初始位置左 
侧且与之相距 z 单位的点的时间的分布的母函数.为了得出初过 
右侧的点的公式，只需交换 P 与心由 (4.8) 可知，在由原点出发 
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的自由随机徘徊中，初过点 z > _ 0 的吋间的母函数为 

又 *0) = ( 子又 2 。)> = Hj ). (4.13) 

对于特殊值« = 1, 是初过右侧一单位的母函数.由0 

出发初过任意的 * >.1 是由0到1，由1到2,…，由 Z — 1到0 
等初过时间的和，因而是具有同一母函数 A ( y ) 的 K 个独立随机变 
量之和这正是 (4.13) 中的式子是一个母 函数的 ^次幂的原因. 

以 f =、代入 （4.13) 即可求得在对手具有无限赌本的情况的 
输光概率.这个概率当？ < 时为1，当 <7 > f 吋为 iq / py . 

5 .明显表达式 

. 现在我们用展开 VM 为部分分式的方法来推导《_的明显 
公式.形式上， C / J >) 的表达式 （4.11) 依赖于一个平方根，.但实 
际上 V z 0) 是一个有限函数.事实上，按二项式定理将 （4.8) 展 
开，我们看到，差紂 0) — 4(0 是$ 的有理 函数与 （1 一 4舛冲 
之积； 这个根式作为一个因子同在 （4.11) 的分子与分母中出现， 
故 U x ( s ) 是两个多项式之比.分母的次数，当《方奇数时等于 
« — 1， 当** 为偶数时等于《 — 2;分子的次数，当《 — * 为奇数 
时等于《 — 1，当 a — 2 为偶数吋等于 fl _ 2 .在任何情况，分子 
次数与分母次数之差不可能大于 1. 故如果分母没有重根，则《«,， 
可由第十一章的方程 (4.8) 来计算. 

我 I ]可以直接计算分母的根及对应的系数，但如果通过 



1 _ 
COS (f) 

2{ pq )^ s 

(5.1) 

引进一个新独立变量中，则运算可以简化.由 （4.8) 我们有 

又1,2(«0 : 

—(子) j ( cos 必士 

i sin </>) = e 

士岵， (5.2) 

故由 （4.1) 得 

= ( 音 r 

sin (d — 
sin a<f> 

(5-3) 
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分母的根显然为 <!>二 0, n/a y 2it/a y 


的对应值为 


2(M)I cos VTt/a 


(5.4) 


令 v === 0, 1， • • •， fl ， 即得 & 的所有可能值.不过，对应于 v = 0 
与 v = a 的值小= 0, 31，也是 （5.3) 中分子的根，又如果《 为偶 

数， 则当〃 = i * 时，不存在与之对应的数因此，当《为奇数 
2 

时，令 v = 1，2 , …， a — 1，即得所有 — 1个根当 a 为偶 

数时 ， v =丄 a 的值必须除外.我们不必考虑也是分子的根的那 
2 

些对它们来说，由 (5-6) 显然有 Pp ^0. 

我们知道 


/ sin (g 一 z )4> 

\ P / sin a < f > 

= As -h B ― + … + - &一 1 — . (5.5) 

— s s a ^ x — s 

为求八，以■^一 ^ 乘两边并令 ^ ^ 像在第十一章（4.5)中一 
样，我们有(令心= Ttv / a ') 


Pv = 


-(f) 

(f)" 


sin (g — z)jtv/a 
. cos vit • {d^/ds)^^ 

sin znvj a - sin -rev/ a 
2 a ( 抑）吾 cosVy/a 


所以当 《 ：> 1 时，由 （5.5) 可得^的系数的表达式 


(5.0 


«,.» = a~ l 2- p ^ n ~^ q ^ n+ ^ cos " -1 — - sin — - sin —. (5.7) 

v«i a a a 


(严格地说，当 a 为偶 数时 ， v = 这一项应于略去，但它为0 

故写^也没关系 .） . 

当《 > 1吋，公式 （17) 表示在第”次试验输光(吸收)的概 
率.这个公式最先是由拉格朗日得到的，现在已有很多不同的推 
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导 方法' I 管它有光荣的历史且有选人教科书的价值，但这个公 
式还是常被重复发现.另一个明显表达式见问题 13. 极限形式见 
第6节及问题〗4 (对于反射壁的类似公式在第十六章第3节中导 
出). 

如果令 fl — oo , 则 (5.7) 中的和可以解释为逼近一个积分的 
黎曼和.用这个方法可以求得，在与一个具有无限赌本的对手进 
行赌博吋(在0处具有单一吸收壁)，具有初始赌本 z > 0的赌徒 
恰好在第》步输光的槪率为 

= 2 n p^ n ~ z) q^ (n+z) j cos B -1 jr * sin jra ; sin • dx . (5.8) 

这个积分可用初等方法》表示如下 

q i(n+z) . ( 5 . 9 ) 

其中如果 i (« — O 不是区间 [0, «] 中的整数，则二项式系数解 
• 2 : 、 

释为 0. 可以求得对应的母函数为 XK 0 '(见第4 •节末). 

6. 趋向 极限； 扩散过程 

我们曾指出，随机徘徊的模型可以作为扩散理论与布朗运动 
的粗略近似，其中细小质点受到大量分子的冲击.每次冲击的影 
响是微不足道的，但很多微小作用的迭加则产生出可观测的运动. 
因此，我们现在要研究一种随机徘徊，在其中每一个别步都极微 
•小,但它们迅速地接连出现.在取极限时，这种过程就像是一种连 
续运动.有趣的是，在取极限时我们的公式仍有意义且与扩散理 
论中具有重要物理意义的公式一致，后者可以在普遍得多的条件 


1) _艾利斯 （ R . E . Ellis ) 在 [22] 中用三角插值法给出了一种初等推导. 

2) 当 P = ? = l /2 时，公式 （5.9) 化归为苐三章中的初过时间分布公式 （4.11). 
证明 （5.8) 与 (5.9) 相一致决不是容易的.也许最简单的方法是证明这两个 
公式都表示差分方程 0-1) 满足在原点处的边界条件 ( 4 . 2^-(4. 3> 的解. 
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下用更加简捷的方法导出 . 15 这部分地说明，为什么随机徘徊的模 
型虽然粗糙，描述扩散过程却相当 成功； 仅仅极限情況具有物理意 
义，但各种离散模型都导致同一极限公式.这里的情形在很多方 
面类似于中心极限定理的条件，其中很多偶然成分的累积效应实- 
际上是与各个成分的性质无关的. 

我们首先考虑从原点出发的自由随机徘徊 3 并令〜„为质点 
在第”步位于^处的概率.如果在》步中有》■步向右，《 — r 步 
向左，则总位移为 >■ — («—»•) = 2 r — «单位.仅当《与 ar 同为 
. 偁数或同为奇数时 3 位移才能等于 * (这意味着偁数步后坐标*是 
—偶数).由”步中选取，步共有 (") 种方法，故 

" \ 

1 \ ph »+» (6.1) 

y(« + x)j 

其中如果|-(« + 不是区间[0, 《] 中的整数，则二项式系数解 

释为 0. 

利用导出差分方程 (4.1) 及边界条件 （4.2) 与 （4.3) 的方法 
可以给出（ 6 .1)的另一种推导.能够证明，必须满足差分方 
程 

Vx , n+l = pVx - l,n + qV tAl ,„ (6.2) 

及边界条件 

^0,0 = 1 i 匕，0 = 0 O #0). (6.3) 

设已给（ 6 . 3 )，在 (6.2) 中依次令« = 1,2, 则首先得到所有 

的值〜然后又依次可得〜& •••• 这表明条件 U .2) 与 
(6.3) 唯一地确定另一方面，容易看出， （6.1) 是一个解. 

现在我们改变长度单位，使得每步长为又假定任何接连 



1) 本节中的极限公式与现在的古典爱因斯坦-维结 ( Einstein - Wicncr ) 理沦中的 
公式 一致. 此处没有考虑新的、更为严密的理论【乌伦贝克 （ Uhleubcck )、 奥恩 
斯垣 ( Ornstein )]. 发现随机徘徊与扩散之间的联系主要归功于巴切利尔 （ L . 
Bachelier ). 他的工作往往是启发性的，但他也导出很多新 结果. 柯尔莫果洛 
夫的马尔科夫型随机过程的理论在很大程度上是以巴切利尔的思想为基础的. 
特別见 [23], 


• 355 • 



两步之间的时间为 △£. 在时间 z 内，质点大约移动了 VAf 步，又 
现在位移 * 相当于 x / Ax 个单位.仅仅 △: t 与的倍数才表示有 
意义的坐标,但如果 A *— 0，仏—0,则每个位移和所有的吋间 
.都是可能的 .- 

如果&与仏按任意的方式趋向于0,则不可能得到可察觉 
的结果，因为在吋间《中最大可能位移等于 tAx / At , 所以如果 
Ax/At - 0,则在取极限时不可能有运动.用物理的话来说，我们 
必须使*和 * 的尺度保持适当的比例，不然的话，过程将退化，而 
方差则趋向于零或无穷.为了求得适当的比值，我们注意，在时间 
t 内的总位移是大约个相互独立的随机变量之和，其中毎个 
具有均值及方差 {1 — (/> — ^) 2 } (Aar) 2 = 4 ~(Aat) 2 . 
于是在吋间£的总位移的均值与方差分别约为^> — △/及 

4^/( Ar ) VA /. 为了得到合理的结果，我们必须令与按这 
样一种方式趋向于0,使得对于所有的 G 上述均值与方差保持有 
限.方差的有限性要求（△乃保持有界，均值的有限性则要求 
p-q 的大小与 Ay 同阶.因此我们令 



其中0与^为常数.£>的值仅仅引入一个尺度 因子； 为数学上简 
单起见，最好是令 D = 1，但为了易于和物理理论比较，我们不指 
定 D 的值.常数 D 与 c 分別为扩散系数与趋向.如果 c = 0，' 则 
随机徘徊是对称的；一般的说，< 的符号确定趋向的方向.在取极 
限时， P 与？趋向于1/2；在任何其它规定条件下，质点都会如此 
迅速地趋向远处，以至位移有限的概率趋向于零. 

在规定条件 （6.4) 的限制下，我们令 Ax — 0, A /^ O . 由吋 
刻 z 的总位移由《次伯努利试验决定，故〜》的极限形式 

由正态分布给出.对于固定的这位移是有限多个独立随机 
变量之和，其均值为— q )^ x/At = 2 c /; 其方差为’ ^ pqti ^ xy / 
At 2 Dt . 所以在吋刻 《 位移位于* •(> 与< ^ i ) 之间的概率 
趋向于: 
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( 6 . 5 ) 


,(2n-)-= r 1 e-^ l d%, 

其中 yi = (^1 — 2 ct )/0， Dt )^, y c = (^0 — 2 ct )/(2 Di )^. 

利用通常的函数记号可将方程 (6.2) 写成如下形式 

"(义，/ + A /) = p • v(^x — Ax ， 名)十穿 • v(^x 4- Ax y 0- 

按照泰勒定理展开到二阶项，我们形式地便有 

^ - ^ = (? — p)Ax 

dt 

dvjx , t ) . ( Ax ) 2 d 2 vCx , t ) . ’ 

dx 2 dx 2 ' 


利用 （6.4)， 取极限得 

dvjx , t ) = _ ^ dv { x , t ) n d 2 v { x , i ) 
Qt dx dx 2 


(6.7) 


这就是福克-普朗克 （ Fokker - Planck ) 的具有趋向的扩散方程，它 
可由更为一般的、更有说服力的假设导出.在通常的理论中，解 
(6.5) 考由 （6.7) •导出的，而我们是在同一极限过程中得到这两个 
公贪 的.'我们的程序只是启发性的，但能严格地予以证明.对于 
离散随机徘徊的所有公式都可以类似地考虑其极限. 

作为一个进一步的例子，考虑初过概率的极限形式.为简单 
起见，我们首先考虑对应于单一壁的公式 (5-9). 两个量与 
^ 2> n +1 中必有一个为零.和+ ti > z , n ^ 渐近地表示在吋间间隔 
0, ^+2 A /) 中吸收的概率.我们将证明，〜 fO ,0 
(2 A 0, 其中 Kh 0为连续函数.于是在任何吋间间隔 （h O 中 
吸收的极限概率为 Kh <) 在此间隔上的积分.当》 — Z 为偶数 
吋，我们有= 0,为求 Kh 0,我们必须用代替 (5.9) 
中的 Z ，用 t / At 代替《，并应用 (6.4). 利用二项分布的正态近似 
及方程 (6.9) 容易求得 1 > ‘ 

1( z , 0---- (6.8) 

2{7tDt^ 

I )在 C = 0的对称情况（即/> = ?)，公式 （6.8) 与第三章 （8.0 中用初等方法导 
出的初过时间旳极限分布一致. 
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这就是 （5.9) 的极限 形式； 它又与扩散理论中的对应公式一致.事 
实上，容易证明， . K—h d 是 （6.7) 的一个解.（在的定义 
中，变量0起着〜中的 一 r 的作用 .）. 

类似的论证适用于 (5.7). 容易看出，如果》— s 为奇数，则 
这个公式中相应于 v = 々与 v=fl —々的两项相消，如果 n — z 
为偶数，则这两项相加.故将 (5.7) 中展布在1 < v < «/2上的 
和加倍，就可得到极限形式 Kh 0 〜 («„„ + .分 

别用 fl / Af ， t / At 代替 a , n , 并注意，对于固定的 v 有 

. ttvAx nvAx 

sin ---， 

a a 

( cos ，心) " A, 〜 （1 _ 〜 ( 6 . 9 ) 

/ /j \ zflC^x 

(4^) ,/2Ai ( —j ~ e -c(.ct+z)/D^ 

我们就形式地得到如下的极限形式 

f ( s , 0 ~ 27 tDa ~ 2 e~ eUt+z)/D Y ] . (6.1*0) 

以上形式地取极限之所以是正当的，是由于一致收 敛性： 当* M 艮 
大时， (6.10) 及原来的和( 5 .7)中相应于 v 的项可以忽略不计(其 
中我们有 v < a /2). 

在扩散理论中， (6.10) 称为初过的弗思 ( Fiirth ) 公式,它可直 
接由福克-普朗克方程导出 .. 在自由扩散中， （6.10) 在时间间隔 
(/ 13 O 上的积分给出从 z > 0出发的质点在先前未经过 壁“的 
情况下在该时间间隔内第一次到达原点的概率. 

*1 . 平面和壺间中的随机徘徊 
在二维随机徘徊中，质点每次沿平行于 x 轴与 y 轴的四个方 

* 本节讨论专门的论题，初读吋可以略去. 
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向之一移动单位步.对于从原点出发的质点来说，其可能位置是_ 
平面上所有坐标为整数的点.每一位置有四个邻近位置.类似， 
在三维'的 情况， 每一位置有六个邻近位置.为了定义随机徘徊，必 
须指定对应的四个或六个概率.为简单起见，我们仅考虑所有方 
向具有相同概率的对称情况.问题的复杂性要比一维的情況大得 
多，因为现在限制质点的区域可以具有任意形状，故复杂的边界取 
代了一维情况的单点壁. 1 

我们首先讨论波利亚的一个有趣的定理. 1> 

定理. 在对 : 称一维与二维随机徘徊中，质点迟早将返回其初 
始位置的概率为1 (因而返回其初始位置无穷多次的概率亦为 1). 
然而，在 三準的 情况，这个概率仅约为 0.35 (于是返回次数的期望 
值为 0.65 S ^(0.35)^ = 0.3.5/0.65 〜 0.53). 

在证明这个定理之前，我们先给出波利亚所作的两种说明.首 
先,由这个定理显然可以推出，在一维与二维的情況，质点经过每 
一 可哮位置无穷多次的概率为1;然而，在三维的情况，上述结论 
却不成立.于是这个定理，在某种意义上，就二维的情况为“条条 
道路通罗马”这一谚语提供了根据. 

另一方面，考虑独立地随机徘徊的两个质点，假定它们每次移 
动同吋发生.它们是否迟早总会相遇？为叙述简便起见，我们定 
义两个可能位置的位移为从一个位置到另一个位置的最少步数. 
(于是距离=对应坐标差的绝对值之和).如果两个质点各移动一 
步，则它们之间的相互距离或者保持不变，或者改变两个单位，故 
它们的距离或者在所有吋刻都是偶数，或者都是 f 数.在第二种 
情况，这两个质点永远不可能占据同一位置.在第1种情况，容易 
看到，它们在第”步相遇的概率等于第一个质点在2»步内到达第 
二个质点的初始位置的概率.因此由我们的定理可知，在二维的 
情况（但在三维的情况则不成立)，两个质点必有无穷多次占据同 


1) 见 f 24 j . 数值0 35是由麦克雷 _( W . H . McCrea ) 与惠普尔 .（ F . J . 
W 1 如 pic ) 算出的，见 C 25：). ' 
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—位置.如果两质点的初始距离为奇数，则用类似的方法可以证 
明,.它们将有无穷多次占据相邻的位置.如果这两种情况都称为 
相遇,则我们的定理 断定： 在一维和二维的情况，两个质点必定相 
遇无穷多次，但在三维的情浼，两个质点永不相遇具有正的概率. 

证.对于一维的情况，这个定理已在第十三章例 (3. b ) 中证明 
过了，只是在那里我们没有提到对称随机徘徊，而是用掷钱.币的例 
子来叙述的.二维和三维的情况可遵循同一路线来证明.设《„为 
质点于第》次试验返回初始位置的概率.根据第十三章第3节定 
理 2 ,我们必须证明在二维的情况发散，而在三维的情况 

^ 0.53. 在二维的情況，仅当沿 X 轴与 y 轴的正向移动的步 
数分别等于沿 I 轴与 y 轴的负向移动的步数时，质点才可能返闯 
初始位置.故如果》为奇数，则、= 0;又利用第六章的多项分 
布公式 （9.2) 有 





_ (:”）! _ 

々！々！（《 — 夂 ）！ O — 々）！ 




(7.1) 


根据第二章公式（12.11)，上式右端的式子等于 ( 2 Jj 2 . 由史 

特令公式可知，的大小与 V « 同阶，故发散. 

在三维的情况，用类似的方法可以求得 


« 2 » 


6 2n 


§ 


( 2 »)! 


iljlklklO 1 — j — 々 ）！ （ w — i — 々）！ ’ 


(7-2) 


其中的和是对所有满足丨+々< «的/，《来求的.易证 


〜 = + (D 苍怪说!(二—( 7 - 3 ) 

在大括号内的项表示三项分布，我们知道，其和为 1. 故其平方和 
小于该括号内的最大项，而后者在 i 与4最接近》/3吋达到.由 
史特令公式可知，这个最大项的大小与 / T 1 同阶，故〜的大小与 
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同阶，由此知 s « 2 „ 收敛.证毕. 

波利亚定理类似于与第十三章例 (3. C ) 中所讨论的投掷多个 
钱币有关的一些事实. 

最后我们讨论推广吸收壁概念的另一问题.考虑两维的情况， 
这时代替区间0 < x < «的是一个平面区域 D , 即坐标为整数的 
一个集合.每个点都有四个邻近位置，但对于 O 中的某些点，有一 
个或多个邻近位置在 Z ? 之外.这种点构成 Z > 的边界，所有其它的 
点则称为内点.在一维情况，边界由两个壁构成，我们的问题在于 
求从 z 出发的质点将在到达《之前到达边界点0的概率.类似， 
现在我们要求质点将在到达某段边界之外的任何点之前至!1达该段 
边界的槪率.这意味着我们将所有的边界点分成两个集合矿与 
设 Or ， y ) 是一个内点，我们要求从 O ,）0 出发的质点将在 
到达 B " 中的点之前到达 F 中的一个点的概率特别，如 
果 S ' 由一个点组成，则 y ) 为质点迟早将在这一特殊点被吸 
收的概率. 

设 （6 y ) 为一内点.在第一步后，质点从 O , 3；) 栘动到四个 
邻近位置0±1， y )， O , y ± l ) 之一处，如果这四个邻近位置都 
是内点，则我们有 

«(«, y) = — [u(_x + 1, y) + u(x — 1, y) 

斗 

+ u ( j « , y + 1) + «(*，y — 1)]. (7.4) 

这是一个偏差分方程，它相应于一维情况的方程 （2.1) (其中声= 
q = 1/2). 如果 O + 1， y ) 是一边界点，则相应于它的项+ 
1, y ) 必须按 O + 1， y ) 属于 f 或属于 S " 而分别用1或 0 来代 
替.因此,如果当边界点（ I , 7) 在中吋我们令 uQ , 7?) = 1, 
当 O 在 s " 中时令 >7) = 0,则（ 7 . 4 )对所有的内点成 
立.这个约定相应于一维情况的边界条件 （2.2). 

(7.4) 是关于未知数〃(*， y ) 的一组线性 方程； 每个内点对应 
一个未知数及一个方程.这组线性方程是非齐次的，因为在其中 
至少出现 S ' 中的一个边界点，而这个点使得方程的右边出现一项 
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1/4. 如果区域是有限的，则方程的个数与未知数的个数是一样 
的，故这方程组有唯一解的充分必要条件是对应的齐次方程组(对 
于所有边界点令 = 0) 仅有恒等于0的解.由于 y ) 
是四个邻近值《0±1， y )， uCx , y ± l ) 的平均，故它不可能比所 
有这四个值都大，也不可能比它们都小.换句话说， y ) 既不 
可能是严格意义下的极大值，也不可能是严格意义下的极小值. 
故最大值与最小值在边界上达到.因此，如果所有的边界值为0, 
则 y ) 在所有的内点亦为 0. 这就证明了 (7.4) 的解的存在 
唯一性.因为边界值为0与1，故《(*，>0的所有值在0与1之 
间，这正是它们作为概率所应满足的条件.根据关于无限马尔科 
夫链的一个一般定理，我们将看到，以上陈述对于无限区域的情况 
也成立\ 


8. 广义一维随机徘徊(序贯抽样） 

现在再来讨论一维的情况，但放弃质点每次移动单位步的限 
制.代替的是，我们假定，质点在每一步从*移动到 r +乂的概率 
为 h ， 其中整数々可以为零、为正或为负.我们研究如下的输光 
问题： 质点从位置^(0< 2 <«) 出发； 我们要寻求质点在它到 
达任何> a 的位置之前到达 < 0的某个位置的概率换句话 
说，质点在时刻》的位置是 * 轴上的点 Z + X l + X 2 +--+ X n , 
其中 { XJ 是具有共同芬布的相互独立的随机 变量； 当 X , + 

* • • + X B < 0或 X :十 .•. + X „ > a — z . 第一次出现吋过程停 
止. 

这个问题，由于它与序贯抽样有关而受到普遍的注意.在那 
里， Xf 表示样本或观察的某种特征.测量一直进行到和\ + 

• • • + X ,落在两个事先选定的界限(即一 Z 与《 — o 之外为止. 
第一种情况导致拒绝，第二种情况导致接受.首次讨论这种抽样 

1) 仅仅得到了几种特殊情况的明确解答，这些解法都极为复杂.关 f 矩形区域、 
无限窄条区域等的解法见 [25]. 
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的是巴特基 （ w . Bartky )^; 瓦尔德给出了一般理论的概要，以上 
的说明也是他给出的 1 2) . 

不失一般性，我们将假定，沿正向和$向移动都是可能的.否 
则= 0或= 1对所有的 s 成立. 

第一步输光的概率显然为 

Tz = P-z + P-z-l + P-z-Z + . . . (8.1) 

(这个量可以为 0). 仅当质点移动到的位置 * 满足0 < * <。时， 
随机徘洄才能继续 下去； 质点从 Z 跳到 * 的槪率为其后输 
光的概 率为〜 .故有 

a — i 

= 2 u rpx- x + T z . (8.2) 

*•= 1 

这里我们又有 a — 1个线性方程，其中有— 1个未知数％. 
这组方程是非齐次的，因为至少当 z = 1时的概率^是异于0的 
(我们曾假定沿负向移动是可能的，由此显然有 n > 0). 

我们要证明对应的齐次方程组 

a - I 、 

W * = 2 « r^- s (8.3) 

^ = 1 

仅有恒等于0的解. 

事实上，如果它有另一组解，_则值〜中必有一个绝对值最大 
者，设此值为«, = M > 0. 首先假定弄0,因为 (8.3) 中诸 
系数之和最多为1，故仅当所有确实在右边出现的1 3) (其系数异 
于 0) 都等于 M 且其系数之和为1时，方程 (8.3) 才可能成立.因 
为 P — i 笋0，故= M . 用同样的方法可依次证明== 1-3 
== M . 然而，当 z = 1时， （8.3) 中诸系数 p x — z 之和 
小于1，故 M 必须为 0. 以上的论证显然也适用于= 0的情 
况，因为我们可用某个正系数 p k a < 0) 来代替 


1 ) 见 [ 26 ], 并参见第十五章例 （2. D . 

2 ) 见 [27 j . 本书所叙述的方法与瓦尔德的方法不同.还可看瓦尔德的书 [28 J . 

3) 原书误为 p x - t ——译者注. . 
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I . 

- 由此推出， （8.2) 有唯一解，于是我们的问题得以解决.方程 
(8.2) 起着差分方程 （2.1) 的作用.通过引进边界条件 

= la 如果 ^ < 0, 

u x = 0,如果 X ^ a (8.4) 

可使书写简化.于是 （8.2) 可以写成如下形式 

= ^, u x p x ~ s , (8.5) 

其中和是对所有的 r 来求的（由 (8.4) 中的第二个条件可知，当 
x ^ a 时相应的项为0;由第一个条件可知，对应于^ ^ 0的各项 
之和为 G ). 

当《很大时，直接解《 — 1个线性方程是麻烦的，这吋最好是 
利用与第2节中的程序类似的特解法当概率分布{八}中的正 
项较少时，这种方法是可行的.设仅当一 时，以异于 

0,故沿正向和负向的最大的 h 能跳跃分别为 P 与 V . 特征方程 

= 1 ( 8 _ 6 ) 

等价于一个 v #阶的代数方程.如果£为 （8.6) 的一个根，则 
对于所有 h h = ，是 (8.5) 的一个形式解，但这个解不满足边界 
条件（ 8 . 4 ).如果（ 8 . 6 )有 fi + v 个不同的根 〜〜 •• •，则对于 
所有的6线性组合 

« 2 = HA k s \ (8.7) 

也是 (8.5) 的一个解，但我们必须适当选择常数么，使得（ 8 .7)满 
足边界 条件. 现在对于 0< z < fi ， 仅有满足 一 v + 1 
+ p — 1的^值在 （8.5) 中出现.故使边界条件（8. 4 )对于* • = 0, 
— 1，一 2, ...，一 v + 1 及；^=0, a + 1, … , a + ft 一 1 成 
立就够了.因此'我们共有 P + P 个条件.如果 々是 （ 8 .5)的二重 
根，则我们少了一个常数，但容 易賽出 ，在这种情况，〜== 4是另 
一个形式解.在每种情况， fc + v 个边界条件确定 " + r 个任意 
常数. 

例. 假定每移动一步，质点到达四个最近的位置之一，并设 
. p —2 = p-i = pi = p 2 = 1/4. 特征方程 （8.6) 为厂 2 + 广 1 + ; + 
= 4. 为解此方程,我们令 t = s + r 1 -. 作这个变换后，方程变 
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为 广 + Z = 6, 其根为 i =^ 2 y — 3. 由 ^ P 中解出 <，我们 

得到四 个根： 

= j2 = 1 3 5 3 = = —— S 4 = —— -- = Si 1 . 

2 2 

' ( 8 . 8 ) 

因为 A 是二重根，故在这种情况 (8.5) 的一般解为 

u z = Ai ~h A2Z ~ i ~ A 3 s ^ + A4S4 , (8.9) 

边界条件为 w 0 = «_!==!及〜 *n = 0. 它们导出关于系数 
A } 的四个线性方程，最后得出的解为 
.. - 1 ^ ( ( 2 ^ - a) 01 ~ 4 ) - a(sl s ~ a - 4 e - fl ) ( o 10> 

其中6与 A 由 （8.8) 給出. 1 

数值近似. 通常要求出所有的根是麻烦的，但用极简单的方法就可得 
到相当满意的近似.首先考虑概率分布{^}的均值为零的情况这时特征 
方程（8. 6 )有二 重根/ =〖，又^ &为 （8.5) 的一个形式解.当然要满 

足 M + 〃个边界条件 （8.4), 仅有两个常数 Z 与 B 是不够知.不过，如果我 
们确定 W 与 S ， 使得 d + fo 当 S =« + ju — 1时为0,当 J ： = 0时为1,则 
当时 J + 当 a <3 ：<a + fi 时 j + Bar 為 0 ，故如 果用“ 大 

于或等于”代替 (8-4) 中的等号，则4 满足这个边界条件.所以差^ + 

- « a 是 （8.5) 的具有非负边界值的形式解，故有 A + B Z - «,>0. 与此 
类似，确定2与 B , 使得 j 当 * = «时为0,当* = — P + 1时为1,则 


可得出《，的下界.因此我们有 


< ^ 


+ /i — S — 1 
U g — 1 ' 


( 8 . 11 ) 


如果《很大(相对 P + 〃而言)，则这个估值是极好的.（当然，~ (1 - 
=/«) 是一个较好的近似公式，但它未给出误差限 .） . 

其次，考虑分布 {?*} 的均值不为零的一般情况.这时特征方程 （8.6) 
有里根 < = 1. 当，->0及 co 时； （8.6) 的左边趋向于 oo . 当，为正 
时 ， y ==!> 〆 是连续凸曲线，又因为它在 r = I 处与直 线1 = 1相交，故必 
定还有一个交点.因此特征方程 （8,6) 恰有两个正根1与和前面一样， 
A + 是 （8. 5) 的一个形式解，又我们能将前面的论证应用于这个解.于 
是在这种情况，我饤求得 
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( 8 , 12 ) 


总结以上讨论，我们存如下的 

定理.如果 {#>*} 的均值为零，则我们的输光问题的解满足不等式 
(8.11); 如果{外}的均值不为零，则这个解满足不等式 （8.12). 其中6为 
(8-6) 的不等于1的唯一正根，^与〃分别为使得九# 0的最大与最小的下 

标. 

设《 = 为一次试验中的期望赢利（或步长的期望值).由 (8-6) 
容易看出，当 《* < 0时，〜> 1;当《 > 0吋， ^<1. 令 《 — 00,由我们的 
定理可以推出，在与具肴无限赌本的对手进行赌博时，最终输光的概率为1 
的充要条件是 w 名 0. ' _ 

赌博的持续时间可用类似的方法来讨论（参见问题 9). 



1. 试就作了如下修改的随机徘徊考虑第2节与第3节中的输光问题: 
质点每次向右或向 fe 移动一单位步，或者停留在原来的位置，且对应的槪率 
分別为«, r (a + ^+ r = 1). (用赌博的话来说，就是赌博可以有平 
局 .） 

2. 就原点为弹性壁(如第1节所定义)的情况考虑第2节与第3节中的 
输光问题.输光（在原点吸收）概率的差分方程与期望持续时间的差分方程 
是相同的，但边界条件 不同. 

3- 设质点每步向右移动两单位或向左移动一单位，其对应的概率分别 
为/ •与 g 0 + g = 1).' 如果出发位置为2 > 0,试求质点迟早会到达原点 
的概串_ (这是与具有无限赌本的对手进行赌博的输光问题 .） 

提示： 对应于 （2.1) 的方程有特解心=1及两个形如 V 的特解，其中 
A 满£一个二次方程 • 

4. 在第8节中的广义随机徘 徊中令 [与 （8.1) 类似+ 
+ Pa +1 -, + 并设心.■为赌博恰 在第” 步结束的槪率.证明当 
» > 1时有 

« — t 

^* s ir+i ^ 〉 1 心，》 Px~»9 

x = i 

其中 因而证明母函数之 (0 =£4, 〆 为线性方程组 
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广 1 心 （o — S ^ 

X s 1 

的解.由微分法可以推出，期望持续时间〜为 

4-1 

<% — 2 e ^~* ~ 1 
XB 1 

的解 •. 

5. 在以点0与《为吸收壁、初始位置为 z 的随机徘徊中，设(乃为 
质点于第 n 步到达位置 * 的概率.求确定^..(*)的差分方程与边界条件. 

6. (续上).试&出当点0与 a 为反射壁(即5= 1的弹性壁)时的边界 
条件. 

注意.在以下的问题中，•是在由原点出发的随机徘徊中，质点于第 
”步到达位置 * 的概率 （6.1). 

7- 映象法设/> = 4 = 1/2. 考虑在原点具有吸收壁、初姶位置为 * 
的 （0, «>) 中的随机徘徊.设为质点于第》步到达位置 r 的概率. 
证明 «>,,(*) = - [提示.证明对应于 （4.1) 的差分方程及造 

当的边界条件得以满足 .] 

8. (续上).如果原点为反射壁，则 

'9. C 续上).如果随机徘徊限制在中，且两个壁都是吸收的，则 
“*,*W = ^ 1 { v x ~ a — ikt,m 2*4,*} J ‘ (9.1) 

歲 

其中桕和是对所有的々（正的或负的)来求的(仅有有限多项异于零).如果 
两个壁都是反射的，则用加号代替减号后方程 （9.1) 仍成立. 

10- 最大坐标的分布.在自原点出发的^称自由随机徘徊中，设 M , 为 
质点在时刻 0 , 1 , 2 , 的最大横坐标.利/用问题7中的公式证明 ■ 

P { M . =3} = + ! ， jr+l ,n. (9.2) 

11.设 W = (参看问题7前面的注意).证明当 _r < 0时 

V . 0 ) = 当 * > 0时 V ,( s ) = ^ o ( OV (0 9 其中 \0) 与心 0) 


1) 问题7—9是映象法的例子.项•对'应于自由随机徘徊中一个质点，匕 
则对 应于一 个“象 点”/ 在方程 （9.1) 中有从各种位置出发的象点，它们由在两 
个边界处的重复反射而得到.在问题 .12 与 .13 中，我们利用母函数得到关于非 
对称随机徘徊的一般结果.在差分方程论中，总是把映象法归功于凯尔文.等 
价的反射原理则通常归功于安德.参见上册第穴页脚注. 
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由 0.8) 定义.此外， n (^) = (I - W ， )- 1/， . 

注.笫4节末曾证明，与心 (0 是初过时间的母酸数;以上关系可 
直接由这个事实推出. 

12. 考虑在原点处具有吸收壁、初始位置为 s 的（：0, 00) 中的随机徘 
徊，设为质点于第》步到达位置 x 的概率，令 

0 O 

A：) ― W 3 ， •( 文 ) 々 * (9-3) 

* 5=0 

利用间題11证明 v x ( s ； x ) = v x ^0) - ^(0 hCO . 由此推出 

«*，》(>)= ，•一 O / p )* . 〜 • (9.4) 

试与问题7中的结果相比较，并用组合方法由后者导出 (9-4). 

13. 输光概率的另一公式_将 （ 4 . U ) 展开为几何级数 5 由此证明 

«,„= s (合 -- s {~y^ - 一 ” 

其中％,,由 （5-9) 定义. 

14. 如果将第 6 节中的极限过程应用于前一个间题中所给出的《«，•的 
表达式，试证明在长为的一个很短的时间间_内吸收的概率渐近地为 1 > 

+ 09 

丄 A/(jtD/ 3 )— ““2 ( z + 2ka)^ 4(z+ ^ a> ^ D \ 

2 A =—oo - 

(提示.•应用正态逼近于二项分布 .） ' 

15. 2 > 输光问理的更新方法.在具有两个吸收壁的随机徘徊中，令〜,》 
与《?,，分別为在左壁和右壁处吸收的概率 • 以造 当的解释证明下列两个方 
程 成立： . ， 

V^{s) =^ 0)^(0 + U*(s)V_.(s), - 

U0 = U,(s)V.(s) + U*(s)V,(s). 

通过认这两个方程中解出 K 0) 来推导 （ rn ). ' 

16 . 设 《,.,(*) 为从® 出发的质点于第”步到达 r 处的概率.利用问题 
15中的记号，证明对于相应的母函数 u ,( s ； X ) = S 》0>"我彳门有 

U.0; X) = V x _,{s) - U 山 ) v x ⑴一 C7*(0 U0. 

(不需计算 .） 

17. (续上).上个问题中的母函数可用如下方法得 到：令 


1) 这新公式与极限形式 （6.10) 的一致性是西它函数论中的众所周知的事实. 

2) 问题 15.-17 包含有关于一维随机徘徊的一些主要结果的独立的新推导. 
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V,{s, x) = - WAKO - BAf(x), 

选择适当的常数 B , 使得当 s == 0 及 S = « 时 U „( s ; x ) = 0 的边界条件 
得以满足.对于反射壁边界条件为 x ) = t /心； 0及 U,Ol = V a _ t 
( s ； x ). 

18. '> 考虑自原点出发的对称自由随机徘徊.证明第》•次返回原点在第 
»步发生的概率等于初过 r 在第 （ n — 0 步发生的概率.（提示.比较两者 
的母函数 .） 

19. 用解适当的差分方程的方法证明 

= (2jt) - ' 2" p ( " +,c V 2 J cos "l • cos tx • dl^ 

进一步推出 .， 

= ⑻ {i) 7 L i 一 2(p^:'7Tc DSt dt - 


■ 20. 在三维对称随机徘徊中质点经过任何特定直线* = ™ 3 y = » 无限 

多次的概率为 1. (提示.参见问题 1.) 

21- 在目原点出发的二维对称随机徘徊中，质点于第》步到达 0, y ) 的 


概率为 


(27r)- 2 2 _ » f* T 
_ 一 * _ —* 


(cos a + cos 卢 ） * • 


cosatck • 


cos yfi • dad^ m 


证明这个公式并求出三维情况的类似公式. （检 验这个表达式满足适当的差 
- 分方程 .） 

22. 在二维对称随机徘徊中，'令 R = ^ + 〆 为在时刻《质点与原点距. 
离的平方.证明 E ( D 〗）=». [提示.计算 E ( D “，一 D •广] 

23. 在维随机徘徊中，质点无限多次返回它先前占瑪过的位萱的概率 
为 U [提示：在每一步移动到新位置的槪率最多为 （2 d — 1) - T - 2(/ # ] 


1) 这是第三章第4节的定理 3. 
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第 + 五章马尔科夫链 

1.定 义 

直到现在为止，我们主要讨论了独立试验，它可以表述如下. 
已给一个可能结果 £i ， £ 2 , •…， （个数可能有限或无限)的集合， 
对于每个 E &， 有一个 概率八 与之 相应; 样本序列的概率由乘法性 
质来确定： P {( E , 0 3 E/ t j •••) Ej n )} = P ia p jt - - - p ja . 在马尔科 
夫》链理论中，我们考虑一种最简单的 推广： 允许每次试验的结 
果依赖于(且仅依赖于)它的直接前一次试验的结果.此吋结果 
不再对应于一个固定的概率，但对.于每个对（4, £<) 有一个条件 
槪率与之对应；即 B 知在某次试验中出现 A 的条件下，在下 
次试验中出现 A 的概率为仏.除以外，我们还必须给出在初始 
试验中出现结果的概率根据的意义，对应于二次、三 
次或四次试验的样本序列的概 /率必须由下式 给定： ' 

P{(E,. ， E k )} = a^ iK , P{(E /5 E k , E r )} = a,p lk p Kr , 

P { (丑; .， 五 r ， 五 ■!)} = a iP ) kPk < r Pn * 

-般有. 

®j'，.. • ， (1.1) 

这里初始试验用数字 0 来标号，故标号为 1 的试验是第二次试验. 
(这个约定是方便的，在上章中就已引进了这个约定而未声明 .） 

例 .（ a ) 每个马尔科夫链都等价于如下的嫌子模型.每一个 
下标用一个罐子来表示，每个罐中各装有带有记4 的 

一些球.每个罐的成分是固定的，但各个罐的成分可以不同.在 
第/个罐中抽出带有记号的球的概率为在开始吋（即第 


1) A_ A. MapKOB (1856—1922). 
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零次试验），按概率分布〖《,•}任选一罐，并从该罐中随机地抽出 
一球，如果该球的记号为&，则下次从第/个罐中抽球，如此类 
推.显然，按这种手续，序列 （ E ,。， £;,，…，£,„)的概率由 （1.1) 
给出.我们看出，，马尔科夫链的概念并不比罐子模型更一般，但以 
后将看到，新的记号是更实际和更直观的. 

( b ) 独立试验当然是以上概型的一个特例，此时对一切/有 
PiK ~ a k - 

如果~是在初始（或第零次)试验 出现仏 的概率，则以 > 0 
且= 1. 此外，在&•出现后，下次试验必定出现 某个心 ，故 
对于一切/与々必定有 

Pii + Pn + Pi ; + … =1， Pik . ^ 0. (1.2) 

我们要证明，对于满足这些条件的任何&与由（〗.1)来定义 
对应于》十1次试验的样本空间中的概率是合理的.因为由 U .1) 
定义的数是非负的，故我们只需证明其和为 1. 首先固定/。，/,， 
••*，并将 （1.1) 中的数对所有可能的/’《求和.利用 （1.2)( 其 
中/_ = /»-.), 我们立即看到，此和为 . • p in -加 ， . 因此所有 
(1.〗）型数之和不依赖于又因为 S «,。 = 1,故对于所有 的化此 
和等于 1. 

定义 0.1) 形式上依赖于试验次数，但由以上的论证可知，定 
义 （ M ) 对于所有的》是一致的.例如，为了得到事件“头两次试 
验的结果为 ( E i} E k T 的概率，我们必须固定= i ， /,=々而将 
(1.1) 对所有的 A ，. ; 3 , •••，/„求和.我们已经证明此和为 a iPjk , 
故它与《无关.因此，通常没有必要明确地提到试验的 次数; 事件 
E ir y 在所有试验次数大于 『的样 本空间中有相同的概 
率.关于独立试验，我们曾多次指出，从数学观点来看，最好是只 
引入唯一的无限试验序列的样本空间，并把有限次试验的结果看 
成是一个无限序列的开头部分 15 .同样的叙述对于马尔科夫链也 
是正确的.可惜，无限多次试验的样本空间超出离散概率理论的 


1〕确切地说,应该看成是开头部分相同的无限序列的一个集合-一译者注. 
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范围，而本书第一卷是限于讨论这种理论的. 

综上所述，我们的出发点是： 

定义. 可能结果为 Eu 的一列试验称为一个马尔科 

夫链 1 \如果样本序列的概率由 (1 .D 定义，其中 { a k } 为状态心 
在时刻0的初始概率分布，为在上一次试验中出现 E ; 的条件 
下，下一次试验出现仏的条件概率. ' 

现在我们将改变以上的术语，使之与物理应用中的习惯相一 
致.我们把&第”次试验出现结果 E 广说成是在 时刻” 系统处于 
状态并称条件概率为巧^ E & (由状态到状态£彳）的 
转移概率. 


转移概率可以排成一个转移槪率矩阵: 


Pn 

Pn 

?13 ••• 

Pn 

P22 

Pn … 

P5i 

• 

Pm 

Pm … 

• • • • 

• 

« 

• 

• 

* ••難 

• • • • 


(1-3) 


其 •中 第一个足标表示行，第二个足标表示列.显然 P 是具有非负 
元素且行和为1的方阵.这种矩阵（有限或无限）称为随机矩阵. 
任何随机矩阵都可作为一个转移概率 矩阵； 连同初始分布，它完全 
确定一个具有状态 A ， •… 的马、尔科夫链. 

在某些特殊情况，将状态从零开始编号比从1开始编号更方 
便一些.这吋要把第0行和第0列添加到 P 中去. 


2.例 题 

本节中包含很多例子，它们将帮助读者熟悉马尔科夫链的概 


1>这不是标准术语.这里我们所考虑的仅仅是一类特殊的马尔科夫链，严格地 
说，在这里及以后各节中，马尔科夫链这一术语应当用“具有不变转移概率”这 
一短语来加以限制.实际上，一般类型的马尔科夫链是很少被研究的.它的定 
义将在第10节中给出，在该节中马尔科夫性将联系一般的随机过程来讨论.在 
那里读者还可找到并不构成马尔科夫链的相依试验的例子. 
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念.为了节省篇幅，以后我们还要参考本节中的某些例子，但并不 
要求读者将它们背熟.关于古典的洗牌例子见第9节. 

( a ) 假定只有两个状态 E , 与 E 2 (也分别称为“成功”与“失 
败”).这吋矩阵 P 具有如下 形式： 


P=| , L p + q = p+q' = l, 

l P ^ J 

其中 h 〆 分别为成功接着成功出现和成功接着失败出现的概率. 
作为一个特殊的例子，设想一个球&速度±1沿*轴运动.在时 
刻1, 2, •• •，球以概率4改变其运动的方向，而以概率 P 保持其 
运动方向.如果用艮代表速度+1， E 2 代表一1,则转移概率矩 
阵具有以上的形式，其中 〆 ==/>，/ >' = W (这个实验可用大的规 


则钉板来模拟 .） 


( b ) 具有吸收壁的随机徘徊. 设可能状态为 

E a ， 考虑转移槪率矩阵 



-1 

0 

0 

0 

… 0 

0 

0 • 




0 

P 

0 

… 0 

0 

0 



0 

<1 

0 

P 

… 0 

0 

• 

0 

• 


0 

0 

0 

0 

… q 

• 

0 

« 

P 



. 0 

0 

0 

0 

… 0 

0 

1 - 


从每个“内部”状态£ 15 • 

• • 3 

Ea-l 只可能转移右边或左边的 

邻近状态(相应的概率为 

pi,i+l 

BS 

P ， Pi, i-l ^ 


然而 

，从 E 。 或 


E a 中任一个不可能转移到任何其它 状态; 系统可以从一个状态转 
移到另一个状态，但一且郅达&或 A ， 则系统就永远停留在那 
里.显然，这个马尔科夫链仅在术语上与上章所讨论的在 0 与 《 处 
具有吸收壁的随机徘徊不同.在那里，随机徘徊从区间中的一个固 
定点 z 出发.用马尔科夫链的术语来说，这相当于选择初始分布， 


使得〜==1 (因而当^妾 sr 时〜= 0). 如果我们随机地选取初 
始状态，则初始分布为 
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e k — (a -i- l) _l , 々 = 0, 1， ••.，<?. 

( c ) 弹性壁. 下面我们考虑一个矩阵，它与前面的矩阵仅在 
第 1 行 D 和第《 — 1行不同.选取 0 < ff 。 < 1和 0 < 心< 1,并 
令 


一 1 

0 

0 

0 

… 0 

0 

0 - 

(1 — 8o)q 


P 

0 

0 

0 

0 

0 


0 

P 

… 0 

0 

0 

. 

- 

二 


« • • » 

» 

• 

• 

• 

• 

• 

0 

0 

0 

0 

… 0 

P 

0 

- 0 

0 

0 

0 

… q 

谷 up 

(1 — 谷 a)p ~ 


除了由 E , 到的概率为 （1 — 5 0 )^,停留在瓦的概率 为化以 
及关于的类似性质外，这里的转移概率是和上例相同的.当 
知=心= 0时，我们的矩阵和上例中的矩阵完全相同.如果心= 
^ = 1,则£。与 E , 是不能到 达的; 系统从一个内部状态出发，将 / 
从一个状态到达另一个状态，但永远不能到达 E 。 或 £ a . 用随机徘 ’ 
徊的术语来说，后面的情形对应于反射壁(参见第十四章).用赌 
博的语言来说，系统的状态表示一个赌徒的赌本，在这种赌博中， 
两赌徒的赌本之和为当第一个赌徒输掉最后一元时，他的对 
手将这一元退还给他的概率为&，而赌博结束的概率则为1 — 5„. 
具有两个反射壁的赌博永远不会结束. • 

( d ) 循环随机排徊. 仍设可能状态为 E ,， E 2 , •••， E a , 但将 
它 d " 按循■环次序排列，于是 E a 具有邻近状态 E a - t 与 E u 和以前 
一样，如果系统只能到达右边或左边的邻近状态,则矩阵 P 的第一 
行为 （0，/»，0,（)，•••， 0, ？） ，最后一行为 （声，0, 0, 0, ---/ O , q, 
0)，其余各行则和例 （ b ) 中的矩阵一样. ' 

更一般地，我们可以允许在任何两个状态之间发生转移.设 


1) 根据上节末的约定，矩阵在通常意义下的第一行现在称为第 C 行，故此处所说 
的第一行就是通常意义下的笫 二行. 一译者注 • 
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外，？1， * •，， 心- ! 分别表示固定不动或向右移动1, 2 ，…， a — 1 
个单位的槪率(这里，向右移动々单位与向左移动《 —々单位是一 
样的).于是 P 是一个循环矩阵 ' 



■ ^0 


疗 2 

… - 2 

a—\ 


今 a— 1 


今 1 

… 1-3 

h - 2 

P 这 

分 a-2 、 

q a—\ 

^0 

"* * ^ a— 4 

• 

^ci—3 



A 

% 

• * • * 

* ， • ^ a—l 



如果 q = p , q a -i = q 且当时， q k = 0,则这个随 
机徘徊就变成本例开头所讨论的简单情况，[在第十六章例 （2. d ) 
中将续继讨论这个问题.】 ^ 

( e ) 自由随机 排徊.一个自由的 + —维随机徘徊是一个马尔科 
夫链，但最自然的是将状态排成一个双重无限的序列 

E „, E „ E 2 , •••). 为了将转移概率写成习惯的形式，我们必须将 
伏态重新加以排列.例如，对于次序（£。， A , E -:, E 2 , E - 2 , •••), 
P 的第一行变成 （0, p , 6 0, ()，•••)，第二行变成 （<?, 0, 0, A 0, 
0 , •••), 等等.遗憾的是，这时不再具有自然的对称性，且公式变 
得不能令人满意.在二维的场合，情況则更坏，在这种场合，本章 
的方法不便于导出明显的公式，但一般定理是适用的. 

( f ) 扩散的爱伦弗斯特 ( Ehrenfest ) 襆型.我们再次考虑具 
有 。十 1个伏态 ，民， •. •，五 fl ， 且只可能向右边或左边的邻近 
状态转移的链•，但此吋我们令 P hi+ y = 1 - i / a , Pw - fj / o , 故 


P 


' 0 

1 

0 

0 

* • • 

、0 

0 - 

疒 1 

0 

1 — a 

* l 0 

• * « 

0 

0 

0 

2 a" 1 

0 

1—2, 


0 

0 

• 

• 

• 

• 

# 

• 

* 

• 

* 

• 

• 

• • • 

• « • 

» 

* 

» 

» 

« 

• 

0 

0 

0 

0 

# • » 

0 

a~ l 

- 0 

0 

0 

0 

• • • 

1 

0 ~ 
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这个链有两个有趣的物理解释.为了讨论统计力学中的名 
循环问题，爱伦弗斯特 w 考虑了如下的想实 验： 设有《个分3 
布在两个容器^与 S 中.在时刻《随机地选取一个分子并把节 
原来所在的容器移到另一个容器中去.系统的状态由^中分吁 
数目来确定.假定在某一时刻，容器 j 中恰有4个分子.在1 
试验中，系统变成或£&，这要看分子是自/中选出还是自 
中选出 而定; 相应的概率为 々/ a 与— 故我们的链描过 
爱伦弗斯特的实验.然而，这个链也可解释为在中心力作用 T 
扩散，即一个向右移动的概率随着质点的位置而改变的随机徘彳 
如果/ < «/2,则/向右移动比向左移动的可能性更大；如果 j 
a /2, 则由/向左移动比向右移动的可能性更大 .. 这意味着 ， g 
有朝向 r = a /2 移动的趋势，这对应于一个与距离成正比增力 [ 
吸引弹性力.（爱伦弗斯特模型曾在第五章例 （2. C ) 中讨 论过； 
见本章例 (6.0 及问题 12.) 

( g ) 占位问题. 在第一章中我们考虑过将球随机地放人 * 
盒中的问题.设系统的状态由非空盒的数目来确定.如果有/ 
盒是非空的,则下次试验中球被放入一个空盒的概率为 ( a -;)/ 
故这个实验可用一个马尔科夫链来禪述,其转移概率为巧;=；/ 
Pi ， i+i = (a — ；)/ a , 对于/，々 i 的所有其它组合/^ = 0. 初始 
布(所有盒都是空的）为 ft = 1，当1 <々< «时仏= 0.[参 
第十六章例 CZ . e ).] 

( H ) 成功连贯. 在伯努利试验序列中，如果 第”次 试验的 
果为失败，则我们说在 时刻" 我们观察到状态 S 。； 如果最后一 
失败出现在第 n - k 次试验(第0次试验按失败计），则 说在第 》 
试验我们观察到状态换句话说， Et 的下标々表示截至第 
次试验为止的不间断的成功序列的长度.显然，以上所讨论的 
—个马尔科夫链，其中仅仅转移仏―&与^— E & +1 是可能白 


1) 贝 [29] 及. [.50 J . 更复杂的讨论（所用的方法本质上与本书第十六章中的 j 
等价）见 P 〖]. 又见[32_1, 
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于是转移矩阵具有如下形式: 


P 



P 

0 

0 

0 • • • 

<1 

o' 

p 

0 

0 • • • 


0 

0 

p 

c • • * 

• 

ft 

* 

• 

ft • * » 

• 

e 

• 

• 

ft • • • 

番 

• 

• 

• 

• • • • 


(0 循环事件. 上面的例子是一个更有趣的马尔科夫链的特 
殊情况.设#为任一循环事件，其循环分布为 {/„}. 习惯上，我 
们总是说第0次试验#是出现的.如果忒 在第” 次试验出现， 
则我们说在时刻》系统处于状态 E 。； 如果# 最后一次出现是在 
第 n — k 次试验，则我们说系统处于状态(也可以说，我们所 
论及的是负方向的等待时间 .） 和上个例子中一样，如果在第》次 
试验系统处于状态则显然在下次试验中系统只可能转移到状 
态仏（如果忒出现)或£< +1 .令 

h = A+•••+/” q K = ~ \-T ^ 

1 — Sj ， 4-t 

Pk = 1 — <U = ~ 丁二 - s _ . ( 2 . 1 ) 

1 


注意，^意味着 # 的等待时间超过々，且在这个假设下，下次试 
验出现#的概率等于办.因此 转移心 — E 4+1 与 E 4 — £。的概 
率分别为九与—个典型的样本序列具有形状 E 0 E Q E t E 2 E 3 E 0 
E l E 0 E l E 2 E Q E 0 (第一个表示第0次试验).这里等待时间依次 
为1, 4, 2, 3, 1，而这个样本序列的概率则为 UUUUU . 现在 


fi/4/2/3/1 = qoPoPip2qiPo^iPaPiq2qas (2.2) 

这与马尔科夫链中的概率公式 (1.1) 是相符的.以上的推理适用 
于所有序列，于是我们得到一个马尔科夫链，其转移概率矩阵为 
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p 


-% 

Po 

0 

0 

0 …1 

% 

.0 


0 

0 … 


0 

0 

p 2 

0 … 

• 

0 

« 

0 

• 

0 

. • 

pi ••• 

* ■ • • 

• 

_ • 

* 

« 

• 

■ 

• • • * - 


[在例 (6. c ) 中将继续讨论这个问题 .] 

( j ) 序贯抽样. 如我们已在第十四章第8节中所看到的，在 
序贯抽样中遇到如下问题.设 S „ = + • • • 十 X „， 此处 X 。是 

仅取整数值的独立同分布的随机变量，其共同分布为 { p ,}, 々==0, 
±1， ±2, • • •. 对于预先指定的 sr > 0, ^ > 0,存在一个最小的 
« ，使得一^这个《当然是一个随机变量，我们 
所关心的是它的分布及随机事件 S „ < — Z 与 S » > 6的概率. 

这个问题可用具有状态0, 1，2, •…， 6 +^的马尔科夫链来 
描述.设 — 1，并选=作为初始状态.如果 S + S B = 
*■ 并且和 z + Si, • • • , 2■+ Sa-! 中没有一个是 < 0 或•〉 fl ， 则我 
们说在时刻《，系统处于状态*0=1，2, •••， 《); 在同样的附 
加条件下，如果^ + s „ < 0 ,则我们说系统处于状态 0 ,如果 Z + 
S n > a + U 则说系统处于状态《 + 1. —旦系统变成两个极限 
状态0与 a +\ 中的一个，则它将永远停留在那里（即，我们令 
Pm = Pu+l,a^\ = 1). 转移概率矩阵为 


「丄 

0 

0 

0 … 

0 

0 - 

Tx 

Po 

pi 

pi … 

pa—l 

Pi 

ri 

P-i 

Po 

pi … 

Pa-2 

Pi 

尸 3 

P-2 

* 

P—i 

Po … 

Pa—i 

• 

• 

Pi 

• 

* 

» • » 暑 ■ « _ 

^ a P—a + 1 P - a~\~2 P—u 十 3 * * * 

Po 

畢 

Pa 

1 J 

L 0 

0 

u 

0 * > • 

0 
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其中. 

r k = p-k +■ P - K-i + P - k -2 + P - K-i + . _ . • 

及 

Pk ~ Pa- 匕 +t Pa- 々 +2~^~ • • • * 

. 作为一个例子，我们考虑巴特基的二重抽样检查方案.为了 
检查一批货物，抽出大小为 N 的样本，并进行全面检查.假定样本 
是统计独立的，且每个样本中次品的个数具有相同的二项分布. 
考虑到每个祥本中有一个次品的情况，故我们令+ 1等于第々 
个样本中次品的个数.于是当々 > 0吋有 

^ = ( ^ + ! ) ( 2 . 3 ) 

及= q N , p x =， 0(^ < - 1). 检验的程序规则 如下： 抽出一 
个初始样本，如果其中无次品，则整批货物就被 接受； 如果废品个 
数超过〃，则这批货物就被拒绝.当这两种情况中的任何一种发 
生时，检查就不再进行，因此也就没有马尔科夫链.然而，如果次 
品数 z 在范围1 < s < fl 内,则只要链的伏态还在1与《之间，抽 
样就按上述方式一直进行下去.链的状态迟早会变成0 (在这种 
情况，货物被接受)，或变成、+ 1 (在这种情况，货物被拒绝 .） 

( k ) 遗传学中的一个 例子汽 在每一代中选择况个个体而构 
成总体(于是总体的大小保持不变).在每一代中，一个取2与《 
两种形式的特殊基因有 22 V 个代表.如罘在第 ”代中 3出现/次， 
则《出现 2 iV — /次.在这种情况，我们说在吋刻》总体处于状态 
;(0 < j < 2 AT ). 假定交配是随机的，则下一代的成分由 2 N 次伯 
努利试验所确定，其中 Z 型基因具有概率 )/2 N . 因此我们得到一 
个马尔科夫链，其转移概率为 


如 d)U * 


1) 费歇与赖特 （ S . Wriffht ) 详细地讨论过这个问题.用马尔科夫链来阐述是马 
兰考脱 （ G . Mal & oi ) 在 [33] 中给出的， 
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[参见例 （8x).] 

(D 一 个繁殖问题. 在所谓兄-妹交配中，使两个个体进行交 
配，在它们的直接后代中随机选取两个异性个体，并使之交配.这 
个过程无限地继续下去.当每个亲本具有三种遗传型 AA 3 Aa , 
如时，我们必须区别亲本的如下六种 组合： E^AAX AA , 
E 2 — AA X Aa ^ Ei — Aa X Aa 3 = Aa X aa D E 5 = aa X aa y 
E 6 = AAX aa . 利用第五章中的法则，容易看到，在这种情况转 
移概率矩阵为 

1 0 0 0 0 0 

丄丄丄 0 0 0 

4 2 4 

J_ 丄 i_ _L J_ J- 

16 4 4 4 16 16 

0 0 ■ 0 

4 2 4 

0 0 0 , 0 1 0 

0 0 1 0 0 0 

[在习题中将继续讨论这个 问题； 在第十六章例 (4-b) 中给出了完 
备的论述 .] 

3.高阶转移概率 

由 E ; 经恰好》步而转移到上 4 能有各种 途径： 馬 —— 
E it -> ——-在已知系统处于状态 £,■ 的情况下系统 
经过这个特殊途径的条件槪率为如, P hh - ••朽所有可能途径 
的这种对应表达式之和就是已知系统在时刻》■处于状态 A 的情 
况下，在时刻 r + »系统处于状态 E & 的概率.我们用/>史来表示 
这个概率- 

我们特别有说=知及 

P?k = 2 PivPvk- ( 3 . 1 ) 

V 
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应用归纳法容易求得递推公式 

PT 1 ^ = E (3.2) 

V 

进一步对 W 进行归纳，可以得到如下更一般的公式 

pT n) = 2 P % n ) PvV . (3.3) 

V 

这个方程反映了如下的一个简弔事 实：前 《步系统由 /,• 到达某 
个中间状态后》步则从到达恒等式 （3.3) 是马尔科 
夫链的特征.对于更一般的过程(参见第10节），一个类似的方程 
成立，但最后的因子不仅依赖于 p 与々而且也依赖于八 

用由如构成矩阵 P 的同样方法，我们将 P 史排成一个矩阵， 
并用 P fl 来表示.方程 (3.2) 表明,为求 P" +1 的元素我们只 
要把 P 的第 7' 行的元素乘以 P * 的第4行的对应元素，并把所有这 
些乘积加起来.这种运算称为矩阵 P 与 P n 的行对列乘法，在符号 
上用等式 P " +1 = PP " 来表示.因此我们称 P 为 P 的》次幂;等式 
(3.3) 则表亲结合律 P m+ " = P" 1 ?". ' 

为了使等式 （3.3) 对一切《 > 0成立，我们定义; 如下： 

= 1;当 y 关々时 p ( a ) = o . 

例 .（ a ) 在独立试验这种最简单的情况， ■? 的所有各行都是 
一样的，故不用计算就可看出，对一切》有严= P . 

( b ) 在成功连贯[例 （2. h )】 中，》步转移概率可以直接求出. 
例如,经过三步后，系统由仅能到达 E k+i> E 0> E l9 E 2> 对应的 
'概率显然为 〆 ，《，砂，砂 2 . 于是 



q qp p 2 0 0 •,, 


a qf ^ P 2 0 • • • 

P 2 = 

^ qp 0 0 p 2 • * * 

• • • • * 


奉 • • • ■> • • • 

• • • • 鲁 • • » 
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qp 

qp l 


0 

0 


q 

qp 

qp 2 

0 

f 

0 

尸3 = 

q 

qp 

qp 1 

0 

0 

f 


在这种情况， P 显然收敛于第々列元素等于幻的矩阵. 

绝对概率. 再次令 《,• 表示系统在时刻0处于状态 A 的概率. 
于是在时刻》系统处于状态 E 4 的(无条件)概率为 

= S a iP { fk . (3-4) 

I 

通常，我们令过程从一个固定状态 E ,. 开始，即我们取〜=1.在 
这种情况,我们有= pW . 

直观上我们感到，.初始状态对吋刻的概率分布的影响应当 
随着《的增大而逐渐减弱，因此当"根大时，分布 (3.4) 应当几乎 
' 和初始分布无关.如果收敛于一个不依赖于/的极限， 
即 P ” 收敛于一个各行相同的矩阵(如上例中那 样）, 则上述情况发 
生，我们将看到，通常是如此的，但我们必须苒一次考虑由于周期 
性而引起的麻烦的例外情况. 


4. 闭包和闭集 

如果存在某个《 > 0,使得/»$ > 0( 即，由 A 到达的概率 
为正，其中包括 E , = 的情形），则我们称由能到达.例 
如，在自由随机徘徊中，由每 - r 状态都能到达任何其它状态，但由 
吸收壁不能到达任何其它状态. 

定义 .设 C 是状态的一个集合.如果从 C 内的任何状态 E y 
不能到达 C 外的任何状态，则称 C 是闭的. 包含 C 的最小闭集称/ 
为 C 的闭包. 

如果单个伏态构成一个闭集，则称为吸收的. 
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—个马尔科夫链称为是不可约的，如果除了所有伏态的集合 
夕卜，不存在任何其它闭集. 

显然 C 为闭集的充要条件是，当/在 C 中而々在 C 外时恒有 
PiK = 0;因为在这种情况下，由 （3.2) 可知，对于一切》有 = 0. 
于是我们有如下显然的 

' 定理 .在中如果将对应于闭集 C 外状态的所有行和列都 
删去，则剩下一个随机矩阵，其中基本关系 （3.2) 与 （3.3) 仍成立. 

' 这意味着，我们有一个定义在 C 上的马尔科夫链，且这个子链 

可以不涉及所有其它状态而独立地予以研究. . 

当且仅当1时 ，状态 是吸收的，在这种情况，上述定 
理中的矩阵缩成一个单一的元素. 状态巧 的闭包是能由它到达 
的所有元素（包括 A 在内)的集合.这个附注可以改述为如下有 
' 用的 / 

准则. 一个链为不可约的充要条件是由每个状态能到达任何 
其它状态. - 


例. 为了求出所有闭集，只要知道中哪些为0哪些为正就 
够了.因此，我们用*表示正元素，并考虑一个典型矩阵，如 


000 *0000 求 
0 * * 0 * 0 0 0氺 


0000000*0 
* 0 0 0 0 0 0 0 0 


P == 0 0 0 0 木 0 0 0 0 


0 本 000,0000 
0*0 0 0 ** 0 0 


0 0 * 0 0 0 0 0 0 
000_木0000木 


在第五行中只在第五列处出现一个 * ，所以知=1，故 e 5 是吸收 
的.第三行和第八行各仅有一个正元素，敌显然 E , 和 E 8 构成一 
个闭集.从可能到达艮与 A ， 而从那里仅能到达&，五4, 
故这三个状态£,， E 4 , 构成另一闭集. 


. 3 R ? • 



很清楚，的复杂性主要是由于记号不方便而造成的.现在 
让我们将状态重新编号 如下： ' 

E ； = E 5 ; E ' 2 = E 3 ; E ' 3 = Z? 8 ; 

E；= £ 1； E ； = E ； = E 4 ; 

E;= E 2; E ' 8 = E 7; E ； = E 6 . 

将矩阵 P 的元素按同样的方式重新加以排列，则 P 变成如下 形式： 

氺 000 00000 
00*000000 
0 氺 0000000 
00 00 氺氺 0 0 0 

0000 氺氺 000 

0 0 0 氺 000 0 0 

氺氺 00 氺 0 氺 00 

0 0 0 0 0 0 氺 泳氺 

0 0 0 0 0 0 氺 0 '0 

在这种形式下， CE ;)， ( E ;， ED 与 u \， 为闭集是很明显 
的. 从巧 可以到达这三个闭集中的任一个，故€的闭包是由状 
态仏 E f 3 , E\ 9 E 、， K ， 冗所构成的集合.由私可以到达 S ; 
与以，因而可以到达每个状态 1 ^故忠的闭包由所有 t 九个状态所 
组成.由 K 能到达(因而能到达 E ; 的闭包中的各个状态），但 
不能到达以，故巧的闭包是除 < 外的所有伏态的集合气 

依次删去 （ E ;)， （£;，£;)与 （庆， E ;， 瓦）这三个闭集之外的 
所有行与列，我们得到三个随机子矩阵 

" 0 氺 本 

「0 氺 "1 

[氺 ] 0 氺尔 

L* 0 」 

氺 0 0 

且 K 不包含与这三个矩阵不相重叠 1 2 3 ) 的其它随机子矩阵. 

1 ) 原书为闭集，不贴切——译者注. 

2) 这句话是译者改写的——译者注. 

3 ) 原书无“不相重查”的限制，这是不对的；因为闭集芣止三个，——译者注 


(4.1) 
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建议读者求出第 2 节各例的矩阵中的闭集和吸收状态. 


5.状态的分类、 

考虑一个任意的固定状态 E ,, 并假定在初始时刻系统处于状 
态 E 卜 每当系统经过吋，过程重新和以前一样从头开始.所以 
返回呙單然是一个如第十三章所定义的循环事件.如果系统从 
另一状态 E , 开始，则经过变成一个如第十三章第5节 所定义 
的延迟了的循环事件.因此，马尔科夫链只不过是循环事件的一个 
特殊情况新的特征仅仅在于我们现在是同时考虑很多循环事件. 

每个状态的特征可由其循环时间的分布{/^'}来刻划.这里 
fi n 、 是在 时刻” 第一次返回巧的概率 . /严可由用如下显然 
的递推关系来计算4 

/；° = Pin // 2) = — if Pa* *** s 

i) n) = - - iWr 2 、 - fr°pa 3 <5-1) 

这些公式当然仅仅是第十三章关于循环事件的基本关系 （3.1) 的 
一个特殊情形.和 

h = S ff a) (5-2) 

n= 1 4 

为从 E ; 出发系统迟早要返回•的概率.如果/; = 1，则称状态 
E ; 是常 返的; 在这种情况，平均循环时间为 

C 0 

(5.3) 

n=l 

如果 . U ; == 0,则我 们称巧 为消极常返的，或称它为零状态. 

如果系统从 £：,• 出发，则直到第一次经过的等待吋间具有 
分布，此处 ’ 


1) 这些关系式表明，在时刻》第一次回到 E ; 的槪率等于在时刻《返回的槪率减 
去在某个时刻 y = 1，2,— 1第一次返回且接着又在时刻《返回的概率_ 
用第十三章 (3.1) 中的记号来表示时，我们有〜= /„• 
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/5V = Pa, = p\f - E io- v W. (5-4) 

w = l 

这个方程并不是马尔科夫链所特有的，而是对任意的延迟了的循 
环事件都成立.显然，如果 E , 不能由 E , •到达，则对于一 切”有 
f^V = 0 . 一般地， 

r . h = S ( 5 . 5 ) 

n - 1 、 

是由£;出发，系统迟早要到达 E , •的概率. 

现在我们可将第十三章第 3 节与第5节中所证明的事实综述 
如下： 

(1) 如果< 1，则状态 A 是非常返的.对此，充要条件为 
S ^ r < oo . 在这种情况，对于每个/，& /^< oo 显然成立 1 

n~l n—x 

(2) 如果& = 1而平均循环时间内= oo , 则是常返零状 
态.对此，充要条件是 = m 而 Mr — o . 在这种情况 1 \ 

n = 1 

当 B -♦ oo 时，夕;5° — 0 (5.6) 

对每个 f 成立. 

(3) 如果当》不能被正整数/ > 2除尽时，恒有/^>.= 0,且 
t 是具有这种性质的数中的最大者(即，除非在第々 3 匕••-等 


步上，系统不可能返回 E ,)， 则 E ; 具有周期 /. 


(4) 如果 E ,. 是常返和非周期的，则 15 


当> 00 时，於） 一 》 ' 

(5.7) 

特别， 


.当; J — 0O 时，>以—"广. 

(5.8) 

(如果 Ey 是零状态，则令 K 1 = 0.) 

i 



(5) 如果均是常返的且有周期。则 （5. S ) 用下式来 代替: 


当《 -> 00时，你"-> 中「 1 . (5.9) 


1) 这可直接由 （5.4) 得到，但它实际上是第十三章第5节中的定理的特殊情況. 



非周期的常返非零状态称为遍历的 》 

例 .（ a ) 考虑第 4 节的例子中的矩阵 P ' (略去了记号 “〃）. 
状态 A 是常返的 （ 因为它是吸收的）.从 E 2 , 系统必定变成而 
且又从那里回到 E 2 . 所以 E 2 和 E , 是常返状态，其周期为2,平 
均循环时间亦为 2. 状态艮构成一个闭子集，且它们之 
间的转移规律由 （4.1) 中最后一个矩阵来表示，由 g 易知，这些状 
态都是常返和非周期的.（稍后我们就将看到，在有限马尔科夫链 
中不可能有常返零状态 .） ' 

从為到达这些闭集之一是可能的，到达后系统就永远停留在 
-其中;故 E 7 是非常返的 .由艮 系统能到达而且由 E , 不可能 
回到 e 9; 故 e 9 也是非常返的.最后，由 e 8 出发，系统迟早将到达 
Ey 或£ 9 ,而由 E 7 或 E 9 不可能返回 Ea ， 故 E 8 是非常返的. 

( b ) 在自由随机徘徊中[例 (2. e ) J , 如果^ = 则所有状态 

都是常 返的; 如果 f # ?，则所有状态都是非常返的[见例 （8. d )]. 

要判定一个伏态是否为常返状态通常是不容易的，且 
敛散性的判別准则通常也难以应用.一个较好的准则将在下节的 
定理中给出. 

设£>是一个固定的常返状态，是能由它到达的某个状态. 
此外，设 w 为 由巧到 的最短的可能途径的长度，并令== « 
> 0.由仏到心的概率必定为正，因为不然的话，系统不能回到 
E ) 的槪率至少为《，于是< 1 一《 < 1，而这与为常返的# 


设矛盾.故存在一个指标 M ， 使得/>以= 

= 〆 >(). 

现在，对于任 

意的》 

* 我们显然有 




^ r w+M) ^ = 


(5.10) 

及 


中 P 皆. 

(5.11) 


1) 遗憾 的是* 没有被普遍接受的 术语. 在第一版中，常返状态被称为循环状态，但 
这个名称易与循坏事件相 混淆. 柯尔莫果洛夫称非常返伏态为非本质的，但新 
的研究表明，理论和实践的主要兴趣都集中于非常返状态.遍历这一术语（它 
与“常返、非零、非周期”同义）是相当普遍地被接受的，但“正 55 状态是现存的其 
它术语之一，而且有时“遍历”被看成是与常返同义的术语. 
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由以上二式可知，序列 与 具有相同的渐近状态，由此我们 
能导出重要的结论.首先，我们已假定 E / 是常返的,故级数2 〆 # 
发散.由 （5.11) 可知， S /4 V 也发散，故 A 必为常返状态.如果 
p ) j 、— o , 则也有此> — 0,反之亦然.最后，设馬有周期因为’ 
经 N + M 步回到 E ,. 是可能的，故 IV + M 必为《的倍数.于是 
由 （5.10) 与 （5.11) 可知，£;与 A 必有相同的周期. ' 

因此，我们看到，从常返状态仅能到达常返状态，且它们都具 
有相同的 类型： 或者它们都是零状态，或者都是遍历的，或者都是 
具有相同周期的非零状态.一个常返状态的闭包 c ■是一个不可约 
集，它的子矩阵定义一个以 C 为状态集的马尔科夫链，它可以不依 
赖于其余状态而被加以研究.于是我们已证明了如下重要的 

定理. 在不可约马尔科夫链中，所有的状态属于相同的 类:或 
者它们都是非常返的，或者都是常返零伏态，或者都是常返非零伏 
态.在每种情况，它们有相同的周期.而且每个状态能到达每个 
其它 状态. 

在每个链中，常返状态能唯一地分解为若干个闭集 c ls c 2 , 

使得从一个给定闭集中的任一状态能够到达该集中的任 
一状态而不能到达其它状态.所有属于同一闭集的状态必定 
是同类的. 

除闭集外，链中通常还包含非常返伏态，从这些状态能到 
达闭集 G 中的状态(但反之不成立). 

这个定理有如下有趣的 

推论. 在有限马尔科夫链中不存在零状态，也不可能所有状 
态都是非常返伏态. 、 

证.考虑不可约链就够了.如果所有状态都非常返状态或都 
是零状态，则对于每一固定的对7'，々，当》 — ^时我们有 — 
0. P " 的每一行趋向于零，而行和等于 1. 显然在有限多项的情况 
这是不可能的，于是我们得出 结论： 在有限不可约链中旣不存在 
非常返状态也不存在零状态. 

由以上的讨论可知，把状态适当地重新编号后(如我们在第4 
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节的例子中 所做的 那样），对应于链(为叙述方便起见，设这个链有 
两个闭集 Cl 与 c 2 及一些非常返状态）的矩阵 P 能够写成如下的 
分块矩阵的 形式： 


0 0 
P = 0 p 2 o 
ABC 


其中 Pl 与 P 2 是两个闭集中的转移概率 矩阵. 


(5.12) 

于是矩阵 P " 与 P 有 


相同的形状，只是要把广， p » c 换成 n , p n 2 > c a (而 a 与 b 则要 


换成更复杂的矩阵，这将在第8节中来研究).注意 ，巧， &与 C 
是方阵，而 W 与 B 如同在例题中一样，可以是长 方阵. 


6.不可约链的遍历性 

-在本节中，我们仅讨论非周期链;如同在一般的循环事件中一 
样,对于周期链只要作一些简单的修改，但要确切地陈述则相当麻 

烦. 

定义. 概率分布 {&} 称为平稳的，如果 

Vi = 啼“. (6.1) 

i 

如果初始分布碰巧是平稳的，则絶対概率 {4*1 不依赖 • 
于时刻》，即4° = 如果我们设想有大量过程同时进行：;则平 
稳性的物理意义就变得很明显.假如，设有^个质点独立地作同 
—类型的随机徘徊.在时刻》，处于状态 E a 的质点的期望数为 
時. 如果初始分布是平稳的，则这些期望数保持不变:，于是我们 
观察到(如果^很大因而可以应用大数定律的话)一个宏观的平衡 
状态，它是由于大量相反方向的转移造成的.物理学中大多数统 
计平衡属于这种类型；即，它们完全是由于对很多独立质点的同时 
观察的结果.典型的情况是对称随机徘徊(或扩散）：如果有很多 
质点被观察，则在充分长的时间以后，它们之中大约有一半在原点 
的右边，其它的则在原点左边.尽管如此，由第三章第 5 节的反正 
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弦定律可知，在单个地考察吋，多数质点的行为与此有偏离，它们 
在大部分时间内处于原点的同侧.只要理解到统计平衡（或稳定 
状态）的槪念并未谈到涉及个别质点性态的任何问题，无休止的讨 
论和错误结论就可以避免.关于系统的趋向平衡有如下的 

定理. 一个不可约的非周期马尔科夫链属于下列两类 之一： 

( a ) 或者所有状态都是非常返的，或者所有状态都是零 状态； 
在这种情况，当《 — 00 时 0 对每 一对; '，々成立，并且不存 
在平稳分布. 

( b ) 所有的状态都是遍历的，即 

lim 4 > 0 ， （ 6 . 2 ) 

其 中力是 的平均循环时间的倒数.在这种情况，{^}是平稳 
分布，且不存在其它的平稳分布. 

将以上的叙述稍加改变，可以把这个定理的含意弄得更清楚. 
如果 （ 6 . 2 ) 成立，则对任一个初始分布 { a k }, W 

a K n) == 2 u k- (6.3) 

所以： 如果平稳分布存在，则它必定是唯一的，且不论初始分布怎 
样，在 时刻” 的分布总是趋向于它. 

证.由前面的定理可知，如果伏态是遍历的，则（ 6 < 2 )成立. 
为了证明上面 （ b ) 中的断言，我们首先 注意： 

(6.4) 

这可以直接由如下事实 导出： 对于固定的/与〜量 = 1 , 
2 , •••） 之和为 1 ，故对于每个 iV 有 Kl + « 2 + • —+办< 1 .在 
(3-3) 中令 .n = 1. 并令 m -* QO , 则左边趋向于以，而右边的和中 
'的一般项则趋向于 

若只加任意有限顼 ，则 我们有 

> 2 (6.5) 

’ V 

把这些不等式对所有的々求和，则在每边我们都得到有限量 2 %. 
这表明， (6.5) 中的不等号是不可能的，故有 
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= S« 也々 . （ 6 . 6 ) 

令 〜 =A . ( SA ) r 1 , 则是一定稳分布，因此至少存在一个 
这种分布. 

设{~}是满足方程 (6.1 ) 的任一分布.用乘 (6 .1) 并对 
所有的 > 求和，由归纳法可知，对于每个 w 有 ' 

V r = 2 V vp ^. (6.7) 

V 

令 n oo 我们得 

«^ r = (^, + y 2 + • •. )« r = «” (6.8) 

这就完成了断言 （ b ) 的证明.如果状态为非常返的或零状态，而 
{^}为一个平稳分布，则方程 (6.7) 成立且 — 0,而这显然是 
不可能的.所以平稳分布只可能在遍历的情况下存在，于是定理 
得证. 

例. （ a ) 爱伦弗斯特模型.在例（ 2 』>中，关于平稳分布的 
条件取如下形式 

«々= (1 - 々 = 1 ) u K - x + ^ 1 «^+1 ( 々 =1 ，…， a — 1 > 

« 0 = 土， u a = (6.9) 

a a 

容易证明，其解由伯努利分布 给出： ' 

“ O ' ( 6 . 10 ) 

这个笱果可作如下 解释： 不论第一个容器中分子的初始数目是多 
少，在经过一段相当长的吋间以后，在第一个容器中找到々个质点 
的概率近似地等于当《个分子被随机分布吋恰有々个分子放入第 
—个容器中的概率(假定每个分子放人第一个容器的概率为 I / 2 ). 
这是赋予我们的结果以物理意义的一个典型的例子. 

当《很大吋，二项分布的正态逼近表品 ，一 旦极限分布 （ 6 . 10 ) 
成立，我们一定能够在每个容器中找到大约一半的分子.对物理 
学家来说 ， a = 10 s 只是一个小的数字.但即使当分子数目 a == 
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10 6 吋，在一个容器内的分子多于505000个(密度起伏约为百分之 
一)的概率的数量级也只有10- 23 .当《 = 10 8 时，千分之一的密度 
起伏有同样大小的概率.虽然系统也有偶然的机会到达可能性极 
小的状态，但它们的循环时间和接近平衡状态的循环时间比较起 
来要大得惊人.物理中的不可逆性在如下事实中显现 出来： 当系 
统处于远离平衡的伏态吋，它朝向平衡移动比沿相反方向移动的 
可能性要大得多. 

( b / 二重随机矩阵. 一个非负元素构成的矩阵 P 称为二童随 
| 机矩阵，如果不仅其各行元素之和等于1，而且各列元素之和亦等 

于 1. 如巣链只含有有限个(比如说《个)状态，则方程组 （6.1) 显 
然有解 q = 1/«.由此推出，如果一个不可约的非周期有限链有 
—个二重随机矩阵 P ， 则 q = 1 /a (即在极限情况,所有状态都变 
成等可能的).在这种情况，不可能有非常返状态.反之，在具有 
二重随机矩阵的不可约无限链中，所有伏态或者是非常返的，或者 
为零状态.为证明这个断言，假定 （6.2 ) 成立.由于矩阵 P 是二 
重随机的，故对于每个固定的々及任意大的我们有 

l = — （ 6 川 

/ = 1 i = I 

由此显然有 a = 0,这与假设矛盾.（这.个证明也适用于周期情 
况 .） . 

, ( c ) 循环 事件. 在例 （2. i ) 中，我们已引人与任一循环事件/ 
相关联的马尔科夫链，现在我们来证明，链的状态总是与 /属于 
同一类型. 

首先考虑#是非常返循环事件的情况；即假定/ < 1. 转移 
串 E ; -♦ E; +1 — E i+2 ->•••— E i+n 具有概率 

1 — 々 +1 . 1 一 心 +2 • • • 1 — S iA-n 

1 — Si 1 — S i+l 1 — i r+n -i 

-= 1 ~~ Si+n Ss 1 (6.12) 

1 — Si 1 — Si 

由此可以看出 3 系统永不进入的概率为正，故所有的状态是非 
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常返的.另一方面，当/ = 1时， (6.12) 左边的项趋向于零，以概 
率1系统迟早要经过£。，故£。是常返的.又因为每个状态都能 
由到达，故链是不可约的.于是我们 看到： 如果彳是非常返 
的，则链的所有状态也是非常返的；如果孑是常返的，则链是不可 
约的，且所有状态都是常返的. ' 

显然，链与#具有相同的周期.现在假定#是非周期的而 
且是常返的.我们必须判定是否存在一个平稳分布,即满足 C 6.1) 
的一个概率分布{^}.在现在的情况， （6.1) 化归为 

^0 = 2 ' 上 +1 —〜， V K = -- — h-1. (6.13) 

,=0 1 — ^ 1 — S K -y 

这些方程有唯一解，即 

CO 

= (1 — ^)^0 = r k v 03 此处 = 2 f „. (6.14) 

0=^+1 • 

为了使 Sh < 00 ,其充要条件是00.但 等 
于平均循环吋间[参见第十一章 （1. S )]. 这就证明 ： 如果平均循 
环时间是无限的，则马尔科夫链的状态是零状态，如果#的平均循 
环吋间有限，则它们的¥均循环命间也有限. 

我们曾由循环事件的性质导出了马尔科夫链的类似渐近性 
质.现在我们又已证明，每个循环事件可以用一个特殊的马尔科 
夫链来描述.因此，马尔科夫链的渐近性态、循环事件的渐近性态 
(即取整数值的独立随机变量的求和理论)、更新理论等三者实际 
上不过是同一解析背景的不同说法，因而本质 上是骞 价的. ' 

在结束本节时，让我们注意，决定是否存在平稳分布因而决定 ■ 
一个已给的不可约链是否遍历是比较容易的.在第8节中我们将 
导出一个区别非常返状态和常返零状态的类似准则.虽然这一问 
题在原则上可由讨论级数的敛散性来决定，但这在实际上 
是很困难的. _ 
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*7. 周期链 

在上节中我们已把周期链的情况排除在外，但这仅仅是为了 
避免由于复杂的说明而掩盖了主要事实，在不可约周期链中， 
渐近性态的刻划容易由上节的定理中导出.为完备起见，我们将 
给出这样一个推导，但以后并不用到本节的结果. 

根据第5节中的定理，不可约链的所有状态具有相同的周期 
t . 考虑周期为 < 的一个不可约链的任两个状态.因为每个状态可 
由每个其它状态到达，故存在正整数《， 匕 使得> 0 及/^ > 
0. 现在> p % H 这表明，经《 + 6步回到 E ; 是可能的， 
故《 + 6必定能被周期 r 除尽.由此可知,如果由&经〜步与 
步都能到达五 b 则 h 〜一定能被*除尽，因而用 /除 与 
吋余数相同. 

因此，对于固定的仏，每个状态相应于某个余数此处 
0 < <* — 1), 使得由 E , •到 A 的转移所经的步数只可能为〜 
v + t , v + It ) v + 3 t i • • 选取 ;'=1, 我们可将所有状态分 
成 Cm G „ •••, G ( _, 等类； 状态属于 G „ 的充要条 件是： 当且 
仅当《 = j ; + rzz 时/^ > 0. 我们将 Gp 按循环次序排列，使得 G tt 
与 G ,_ t 相邻. , 

易知，从 G ,, 中的状态出发，经一步转移后总是到达下一类 
G „ +1 (如果” : — 1，贝 IJ G , +1 为 G 。)； 经两步转移后则将到达 

C v +2 中的状态(从 G ,-』 到达 _<7 a ， 从 G ^- t 到达 G t ) ，等等.最后，经 
t 步转移后必定回到属于同一类中的状态.这意味着在 以产为 
转移概率矩阵的马尔科夫链中，类构成一个闭集.因为原来 
的链是不可约的，故每个状态能由每一其它状态到达.这意味着， 
在转移概率矩阵为 P 的链中，每个 G , 构成一个不可约闭集.于 
是我们有如下的 . 


* 本节讨论专门的问题，初次阅读时可以略去， 
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定理. 在不可约周期马尔科夫链中，状态能分成 * 类 G 。，* • *， 
G t - 1} 使得从中的一个状态出发，经一步转移后总是到达 G„ +l 
中的一个状态(如果 v = / - 1,则到达 G a 中的状态).如 果我们 
仅在时刻 G 2<，3/， • ••来考虑这个链，则我们得到一个新链，其转 
移矩阵为在这个链中，每个 G ， 构成一不可约闭集. 

我们的定理含有关于的渐近性态的完备知识.如果所有 
的状态都是非常返状态或零状态， 则对宁 任意的々有/»货 — 0 .- 
另外，每个伏态具有有限的平均循环吋间丹.设 E # 属于 G ,. 
在 A 上，我们有一个转移概率为的不可约非周期马尔科夫链， 
故存在极限 - 


C ， 


如果 h 在中， 
其它情况， 


(7.1) 


此处〜为在新链中的平均循环时间的倒数，新链昀一步对应 
于原来链的£步.于是 

* 

(7.2) 

利用（3.2)，由 （7.1) 可求得 


lim ，) = {?， 
1 (}, 


如果心在 G v+1 ，中 
其它情况. 


(7.3) 


类似，如果 h 在中，则 p 货 +2) — 以， 等等.换句话说，对于 
固定的 E , •与 E <， 序列/>以是渐近周 期的； 在其中每隔 f — 1个接 
连的零就出现一个正元素，且它们收敛于心= 1/^. 綠、 

由第6节中的定理可知，在每个类 G , 中，&之和为 1. 因为 


有：个类.故由 （7.2) 可知，序列 {1/^} 表示一个概率分布.第 


6 节中的论证直接表明，这个分布是平稳的，且不存在其它的平稳 
分布. 


8. 非常返抉态 

从常返 伏态巧 出发，系统只可能到达 E y 的闭包中的常返状 
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态而且在这种情況下，我们已经得到关于 p 出的完备知识. 
如果 A 是非常返的，而 h 是遍历的，则由 （5.7) 有 

P 泣—成 ％ k ， (8-1) 

其中化 为的平均镇环时间 仏 为从心出发 5 系统迟早将到达 
石 4 的概率.然而，心属于一个不可约子链 C ， 并且从心出发， 
系统必定到达 C 中的每个状态.所以，对于每个固定的乙概率& 
对于 C 中所有状态来说都是一样的.换句话说，如果 C 是一个具 
有遍历状态的不可约子链，而呙是非常返的，则对于 C 中的每个 
Eh 有 

P^iK ^K x ii , ( 8 - 2 ) 

其中 为 hkE ) 出发，系统迟早将进入 C 的概率.显然，对零状态 
来说， （8.2) 的右边必须用0来代替，且在具有周期的情况仅 
需作通常的例行修改. . 

为了完全描绘出马尔科夫链的渐近状态，还须解决如下的 
三个问題 .（ a ) 已给一非常返 状态& 及一常返闭集 C ， 试求 
从圮出发，系统迟早将进入 C (即到达 C 中的一个状态)的概率 

Xy •- " 

( b ) 求出系统将永远停留在非常返状态集合中的概率 y) . , 

( c ) 已给一不可约链，确定其状态是常返的还是非常返的. 
我们将看到，稍加改动后，问题 （ C ) 变成问题 （3) 的一个特殊 

情况. 

设 T 为所有非常返状态的集合，并假定,在开始时系统处于非 
常返状 态馬； 设为系统在吋刻》第一次到达闭集 C 的概率. 

则 - .. 

00 

A = 2 ^ (8.3) 

»= 1 

为系统迟早将到达 C 并停留在 C 中的概率.借用简单的随机徘徊 
的术语，我们将称 A 为被 C 吸收的概率.差1 一 ~说明被其它的 
闭集睃收与(在某些无限链的情況).永远停留在非常返状态集合中 
的可能性. 
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显然， 

= ^Ipi^ ( 8 - 4 ) 

这里的和是对所有在 C 中的状态的下标々来求的.如果系统 
在第« + 1步到达 c 中，则第一步必须由.到达另一非常返伏 
态.因此显然有 

^(.n+o = I p jv xl n \ ' (B.5) 

T 

现在的和是对有非常返状态的下标 v 来求的.方程 (8,4) ^ 
(8.5) 构成逮推关系，由它们可以唯一地确定:^ >. 将 （8.5) 对一 
切》== 1，2, 3，'…求和，即可看出，吸收概 率巧是 线性方程组’ 

々 一 S (8-6) 

T 

的解. ' 

于是我们得到问题 （a) 的一个 回答； 槭率&可以构造性地由 
(8.3) — (8.5) 来 确定； 但把它们看作是线性方程组 （8.6) 的解更 
好.在这种关系下，唯一性问题就被提出，但幸而它是问题 （b) 的 
特殊情况. 

设 )4 a ) 为系统在时刻 ”处于 非常返状态的槪率.显然 /. 

y；° = S 

T 

(8.7) 

y ) n+l) = S P ^ n \ 

. T 

此处的和也是对所有非常退状态的下标 v 来求的.由 （8.7) 可 
以推出，）因而#<俨，一般地 / r iy < y ) n) . 所以极 

限 ： ， 

y ； == lim yf ) (8.8) 

n—oo 

存在； h 为系统永远停留在非常返状态中的概率.由 （8.7) 我们 
有 

= 2 PivVv* ( 8 . 9 ) 



因此槪率满足方程 (8.9), 但这并未解决主要问题，即是否对所 
有的/有 y , = 0. 设方程 （8.9) 存在一个有界解，比方说， 

Zj = Pi V z v3 | r v | < 1. (8.10) 

r 

比较 （ 8.10) 和 （ 8.7) 可得 I 川<#，因此由归纳法可知， U y |< 
y { ^ 对 一切” 成立.由此推出，％ = 0对一切/成立的充分必要 
条件是，方程组 C 8.10) 无非零解.最后，如果线性方程组 （8.6) 有 
两组不同的解，则它们的差就会是线性方程组 C 8.10) 的一组非零 
解.于是我们有 

定理 1. 问题 （ a) 的概率是线性方韹组 （ 8.6) 的解 . 如果从 
任何非常返状态 £,• 出发，系统永远停留在非常返状态的概率 K 
为0,则这个解是唯一的. y , 满足方程(».9). 

注.我们已经看到概率吖可以看作是 (8.9) 的以1为界 的解； 
{^} 具有类似的性质. 

推论.在有限马尔科夫链中，系统永远停留在非常返状态的 
概率为零.从非常返状态出发，进人一个闭集 c 的概率巧是线性 
方程组 （8.6) 的唯一解. 

证.我们必须证明方程 （8.9) 无解.用反证法，设 M 是有限多 
个 h 中的最大者.不失一般性，可将各状态适当排列，使得 y , •按 
递减的次序出现，比如说 yi = yi = =- y a = M > y a+i > y a+i 
> • •• 由 （8.9) 可知，如果 a ，则我们有 

a 

M = 2 Ph = S PivM + 2 PiA. (8-10 

T v = 1 »>>a + 1 

这个等式只可能在对一切 r 。都有 A .- = 0时成立.在这种情 
况， E ls •••, E a 构成一 +闭集 ，而这是不可能的，因为一个有限链 
必定包含常返状态(第5节的推论). - 

定理1可用来计算吸收槪率，即进入一个吸收状态的概率. 

例. （ a ) 具有吸收壁的随机排徊[例 （2. b )]. 取吸收状态 E 0 
为 C . 则； ^ = i 且当 />1 时; ^=0. 方程组 （8.6) 变成 
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x x — px 2 = q. 



Xj — qxj-i — px j+1 = 0 (; = 2, 3， .. •，fl — 2)， 

— qx a = 0 . ( 8 . 12 ) 


这与第十四章中的方程组 （2.1)—(2.2) 是一样的，故其解由第十 
四章中的 （2.4) 给出. 

( b ) 序贯抽样 [例 (2, j )]. 再次设 C 为伏态 E a .则== 

于是方程 （8.6) 化归为第十四章中的 （ S .2)( 其中％代表现在的 
也可参看第十四章中的问题 4). 

( c ) 遗传学 [例 （2. k )]. 这里两个状态 E q 与 E 2W 中的每一个 
都构成闭集.在 E 。 与处的吸收分別; f 味着总体最终仅由 
««型或仅由型个体组成.对于在 E 。 的破收，我们有 4 U = 
Pio = (1 - j /2 Ny \ 于是 (8.6) 取如下形式 


- ■ID ㈤ -士 r 


(8.13) 

似乎有理由认为，如果3型基因与《型基因的比例为 j ：2 N - 

1, 则它们的成活机会也具有相同的比例.如果这是对的，则 (8,13) 

的解必须为 A = 1 — ；(2 iV )-*. 在 （ 8 .1 S ) 中认出均值为 丨 的二项 

分布的项后就容易明，这些 A 确实满足 （8.13). 

最后，我们给出问题 G ) 的一个解答. 

定理 2. 设一个不可约链有状态 E 。， E ,, •••. 为了使状态是 

非常返的，其必要充分条件是方程组 
. <£> 

Vi = Xi Pny^ < = 1,2, • * • (8.14) 

/=1 

有一个非零有界解. 

证，在 { y ,} 的构造式（ 8 . 7 )—( 8 . 8 )中，将 r 解释为状态艮， 
2? 2 , . ••的集合 （ A 的补集).前面的证明无需改变就可以适用于 
现在的情况，于是我们看到，停留在 r 中（即不进人£。）的概率由 
(8.8)' 给出，且满足 C 8.9). 

例 . （ d ) 自由随机徘徊. 例（ 2 .0需要作一 i 记号上的改变， 
因为状态是由 _ oo 到+0°来编号的.不过，很清楚，我们的准则 
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依赖于方程 

y > = py：+i + y 。 = 0， *’=±1， ±2， ... (8.15) 

的解的唯一性.显然，所有的 y , •能由％与1- 1 递推地计算.如果 
沪> ?，则 

y ； = I 1 ~ y-,_ = °，/ = … (8.16) 


是唯一解且是有界的.如果 p = q , 则解为 A = 且是无界的. 
这里我们用马尔科夫链的方法导出了旧的 结果： 加果 P 尹彳，则 
状态是非常 返的； 如果 f = <7,则状 态桌常 返的. 

、 （ e ) 考虑矩阵 


P 


-*?0 

Po 

0 

0 

0 • • * - 


0 

pi 

0 

0 … 

0 

^2 

0 

p2 

0 … 

0 

奉 

0 

《3 

0 

•p3 … 

• 

• 

0 

• 

• * • • 

—» 

• 


• 

» . • • » _ 


它表示（0, 0°) 中具有变转移槪率的一个随机徘徊.它在第十七 
章所讨论的生灭过程的理论中起着重要作用.方程 （8.14) 化归为 
Vi = Pxfi, y ： = qiji-i + piVi+1, *• = 2, 3, • • • (8,17) 

并且可以逐步地解出，因为 

: y ；+ ' — y， : = ， (8.18) 

! yi Vi-i pi 

所以 


yi+i — = yi * — - ^ • (8.19) 

Pi Pi Pi 

把这些等式相加，我们看到，存在一个有界解的充要条件是 2L/< 
00 ,其中 '•- qd ipi ••- 九)一 1 • 所以，如果 < 00 3 

则状态为非常返的，否则为常返的 ' 
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9. 在冼牌问题中的应用 

编号为1,2,…， ZV 的/ V 张牌能排成 iV ! 种不同的次序，每种 
次序表示系统的一种可能状态.每次洗牌使现存的状态转移到某 
个其它状态.例如，“错牌”将把次序 （1 ， 2, • • • ， ZV) 变成循环等 
价次序 （ r，r + 1 ， … ， JV ， 1 ， 2 ， • • •, r — 1) 之一.而逆序经错 
牌后则变成（〜 一 r + 1 ， N — r ， …， 1 ， N ， A/ ■— 1 ，…， N — 
r + 2). 换句话说，我们把洗牌看成是转移 E , — E &. 如果同种 
方式的洗牌重复进行，则系统(从给定的 状态巧 出发)将顺序地经 
过一列狀态，并且在有限步以后，原来的次序将被重新建立.从那 
时以后，同一列接连的状态将周期地重复出现.对大多数洗牌方 
式来说，周期是相当小的，并且决不是所有状态都能由这种程序所 
达到 1 \例如，一次精确的“插牌”把 2 m 张牌从（1，•••， 2 w ) 变成 
(1, m -h 1,2, m +2, m , 2 m ). 对于六张牌来说，四次精确 
的插牌就将重建原来的次序.对于十张牌来说，原来的次序将在 
六次精确的插牌后出现，所以，对十张牌重复进行精 k 的插牌仅能 
得到10! = 3628800 种可能次序中的六种. . 

实际上，玩牌人或许希望改变洗牌方式，并且，无论如何，偶然 
变动总是由机会引入.我们#假定，我们能够通过假定每种特别 
的洗牌方式有某个概率(可能为零)来说明玩牌人的习惯和机会的 
影响.关于这些概率的数值我们无需作任何假定，但假定玩牌人 
洗牌时不考虑过去的情况，也不知道牌的 次序' 这意味着，接连 
的洗牌对应于具有固定概率的独立 试验; 争是，对于实际的一副牌 
来说，我们有一个马尔科夫链. 

现在我们证明，转移概率矩阵 i 3 是二重随机矩阵[例 (6. b )]. 


1) 用群论的语言来说，这相当于说置换群不是循环的，因而不能由一个简单运算 
产生. 

2) 这个假设对应于桥牌中的相应情况.容易设计出更复杂的洗牌技太，在其中， 
每次洗牌的方式依赖于以前的洗牌方式，在这种情況，最后的结凍不是马尔科 
夫链[参见例 Cio .0]. 
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事实上，如果一次冼牌变状态(牌的次序） E , •为£<，则存在洗牌使 
之变成 心的、 另一状 态心. 这意味着，除了次序不同外， F 的笫 
/列与第 7' 行是恒等的.故所有列和为 I . 

由此可知，不可能有非常返状态存在.如果链是不可约和非 
周期的，则在极限情况，所有的状态变成等可能的.换句话说，任 
一种洗牌方式，只要它产生一个不可约的非周期链，都是合适的. 
可以假定,通常情况就是这样.不过，设一副牌共有偶数张，并且 
洗牌的方法是，将它们等分为两组，并用任意的方法分别洗这两组 
牌.如果将这两组牌按它们原来的次序拼在一起，则马尔科夫链 
是可约的（因为不是每个状态都能由毎个其它状态到达).如果两 
部分的次序被颠倒，则链有周期 2. 

我们看到,有理由指望，连续不断的洗牌会产生完全的“随机 
性”并消除原姶次序的痕迹.然而，应当指出，为此所需的洗牌次 
数是极大的 1M] . 


10. —般的马尔科夫过程 


在应用中用随机变量的术语来描述马尔科夫链通常是无便 
的.简单地用整数4来代替上节中的符号 E & 諕能做到这一点. 
于是系统在吋刻”的状态是以概率 4 n) 、取值々的一个随机变量 
X w ; 与 X <" +1 > 的联合分布由 

P{X(") = 7 ， x(— = 々 } = 4 n) /^ . 

给出，而（ X % …， X ， 的联合分布则由 （1.1) 给出. 指定心 
以一个异于々的数值也是可能的，而且有时更好一些.根据这种 
表示'法，马尔科夫链变成一个特殊的随机过程，即(相依)随机变量 
的一个序列 1 •••），上标《起着吋间的作用.在第十 
七章中我们对时间参数连续变化的、更一般的随机过程作初步的 
介绍.‘‘马尔科夫过程”这一术语适用于很大而且很重要的一类随 

1) 明确的表达要参照无穷乘积空间，但实际上我们仅渉及有限多个随机变置的联 
合分布. 
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机过程(时间参数可以是离散的，也可以是连续的).甚至在离散 
的情況，也存在比到现在为止我们所研究过的简单链更一般的马 
尔科夫过程.因此，给出马尔科夫性质的定义，指出刻划马尔科夫 
链的特殊条件，最后，给出几个非马尔科夫过程的例子，这些都是 
有用的. ， 

在概念上，马尔科夫过程是经典力学的过程的概率模拟，在其 
中将来的发展完全决定于现在的伏态而与现在的状态是怎样发展 
来的无关.力学过程与可塑性等理论中出现的有后效过程(或遗传 
过程)形成鲜明的对照，在后者中，系统整个过去的历史影响它的 
将来.在随机过程中，将来的情况决不能唯一地确定，但至少有概 
率关系使我们能作出预言.对于本章所研究的马尔科夫链来说， 
有关将来的概率关系显然仅依赖于现在的状态，而与现在的状态 
是怎样从过去变来的无关.换句话说，如果两独立的系统具有相 
同的转移概率且恰好处于同一状态，则与它们将来的发展有关的 
所有概率都是恒等的.以上的描述相当含糊，现在我们给出其精 
确定义 如下： 

定义. 一列取离散值的随机变量称为一个马尔科夫过程，如 
果对于每个整数 〜<〜<••• <»,<»的有限集合， （ x ( 〜, 
X —，…， x ~， x «) 的联合分布用如下的方式来 定义： 在假设 
XW = 〜•••， A 下，关系 X ⑷= r 的条件概率恒等于 
在单一假设下 X (n ) = *■ 的条件 概率. 这里， A ， 

是使假设具有正概率的任意数. 

这个定义可用较简洁的语言表述 如下： 设在 吋刻〜 已给状态 
则关于系统以前的状态的任何附加知识都不能改变在将来的 
一个 时刻” 的状态 X 的(条件)概率. 

本章所研究的马尔科夫链显然是马尔科夫过程，但它们具有 
不包含在定义中的如下附加性质.对于上节所硏究的马尔科夫链 
来说，转移概率= P { X (m+y = 々 I = /} 不依赖于 m . 更一 
般的转移概率 

= P { X ("> = 々 I X (™) = 7.} (w < n) (10.1) 
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则仅 f 赖于差 «-«. 在这种情况，我们说转移概率是平稳的(或 
不变的).对于一般的整数值马尔科夫链来说， （10.1) 的右边依赖 
于《与 《• 我们将用 «) 来表示它，所以 P ik in, n +1) M 
在时刻》的一步转移概率.代替（1.1)，我们得到路径 〜，“，…， 
;«) 的概率的如下表达式： 

“ 2 U 0 , 2 )— 1 ， 》)■ 、 （ 10 . 2 ) 

显然 （3.3) 的适当推广是如下费式 

Pi ^ m , «) = 2 Pi »( m ， r ) P » k ( r ， n ~)， vlO -3) 

V 

它对于满足不等式 m < r < » 的所有 f 成立.这个恒等式可直接 
由马尔科夫过程的定义也可由 （10.2) 得到; 它称为査 普曼-柯尔英 

果洛夫方程. 

在本章中我们基本上解决了高阶转移概率的渐近性态问题， 
但只有少数几个已建立的性质对于一般的离散马尔科夫过程成 
立.所以我们对一般理论不作详细讨论. 

非马尔科夫过葙的例子. , ' 

( a ) 波利亚罐子模型 [第五章例 （2 x )]. 设 X « 等于1或0 
按照第》次抽出的球是黑球还是红球而定.序列 { X M } 不是马尔 
科夫过程.例如 

P{X (3) —— 1 |X (2> = 1 } = (" 办十 c)/ 4 - r -t- c), 

但 

P{X C3) = 1 |X( 2 ) = 1 ,X (1> — 1 } = (^ + 2 f)/ (厶 + r + 2 c). 
(参看第五章问题 19—20). 另一方面，如果是在时刻》罐中 
的黑球数，则 { Y M } 是具有常转移概率的通常马尔科夫链. 

(b) 高阶和. 设 Y。，^，* ••是相互独立的随机变量，令 S„= 
Y。 +…+ Y „. 则差 S„ - S„ 仅依赖于 Y ro+1 , ,Y n , 并且容 
易看出，序列 {S,} 是一马尔科夫过程.现在我们进一步定义一个 
新的随机变量序列 U„ 为 U rt = S 0 + S, + • • • + S„ (这意味着 
u„ = Y B + 2Y„_! 4 - 3 Y „_ 2 4 - _ • *) .序列 { U„} 构成 一* 个随机过 

. 程，其概率关系原则上能用的分布来表示.过程彳通常不 
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是马尔科夫型的，因为，例如，没有理由断定 PIU , = oIUh = 4 
与 P { U „ = 0| U „_! = a , U „_ 2 == b } 相同;根据关于11„-1 与 1!»的 
知识比单独根据关于的知识能作出较好的预言. - 

在时间参数连续的情况，前面的求和用积分来代替.在扩散 
理论中， Y n 起着加速度的作用； s „ 则为速度，于是 U n 为位置.如 
果仅仅位置能够测量，则我们只好研究一个非马尔科夫过程，虽然 
它是 i 司接地用一个马尔科夫过程来定义的. - 

( c ) 移动平均.再次令 { YJ 表示相互独立的随机变量序列. 

r 阶移动平均定义为 X — = ( Y „ + Y n+l + ••• + Y „ + r _ t ) A . 容、 
易看出，不是马尔科夫过程.在很多应用中都遇到这种类型 
的过程(参见问题 26 ). . 

( d ) 交通问题.为了得到一个非马尔科夫过程的经验例子^ 
R . 弗思 [35] 对某街道上的行人进行了广泛的观察.这个过程的一 
个理想化的数学模型能用如下的方法得到.为简单起见 3 我们假 
定所有的行人有同一速度〃；又我们仅考虑沿一个方向走动的行 
人.在时刻 t = 0,我们将正 f 轴分为长为 d ? 的区间，每个区间可 
能包含也可能不包含一个行人.我们假定，在各区间中的行人的 
分布由一列伯努利试验来确定.换句话说，我们有独立随机变量 

的一个序列，萁中每一个分別以概率 P 与7取值1或 0. 如果 
Y ,= 1,则区间（々 一 IX AT <矽包含一个 行人. 现在设整个 
轴以速度〃沿负向运动，让我们察长为见？的固定区间中的行 
人数，这个! S 间在吋刻^ = 0吋被运动的*轴的区间 
所覆盖.在时刻？这个固定区间被 * 轴的区间〃/ w +NS 

所覆盖.设在吋刻 nSfv 进行观察，并设 XW 为在吋刻》在我们 
的固定区间中被观察到的行人数.则= Y „ + Y „ +1 + ... 
+ Y „ + n _ 0 所以我们的过程，除因子 1/ N 外 ,是一个移动平均过 
程.因此它不是马尔科夫过程.（当3 — 0吋，我们得到一个连续 
模型,在其中普阿松分布取代二项分布而起作用 .） 

(0 马尔科夫过程的迭加(合成洗牌). 

有很多专 门装置(例如电话局、计 数器、 滤波 器 中的选择器 
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群)，它们的动作可用两个马尔科夫过程的迭加(其结果是一非马 
尔科夫过程)来描述.从如下洗牌方法的研究中可以得到关于这 
种机构的清楚了解. _ 

设有甲、乙两组同样的牌，每组各有 V 张.洗牌通常是对乙组 
牌施行.如果它的各张牌的次序是，〜， •…， ~)，则我们将 
甲组牌加以排列，使得第一、第二、…、第 W 张牌分别调动 到第〜 
心，… •，〜个位置.于是洗乙组牌就间接地决定了甲组牌的次序. 
后者构成一个非马尔科夫型的随机过程.为证明这一点，只需证 
明，关于甲组牌的两个接连的次序的知识对未来所提供的线索，一 
般要比关于最后的次序的单一知识所能提供的要多.我们就一个 
简单的特殊情况来证明这 一点. 

设"=4,且假定在初始吋刻乙组牌的次序为 (2431). 此外， 
假定采用“错牌”的方法来洗牌，即次序 U ,， 变成 
«3 J « i)j («„ « 13 « j ), ( a t3 a 2 , « 3 ) 这三个次序之一；我 

们赋予这三种可能中的每一种以概率 1/3. 由于这些约定，在任 
何时刻，乙组牌的次序总是 （2431)，（4312；)，（3124)， (1243) 
这四种次序之一.另一方面，简单的实验表明，甲组牌将逐步经过 
所有 24 种可能次序，且它们之中的每一个将结合乙组牌的四个可 
能次序中的每一个出现.这意味着，甲组牌的次序 (1234) 将极为 
经常地重复出现，且在它之后总是出现 （2431)，（4312)，（3124)， 
(1243) 这四个次序之一.现在乙组牌永远不能保持同一次序，故 
甲组牌不能接连两次遭受同一种排列.因此，却果在时刻(*-1) 
与 h 甲组牌的次序分别为 （1234) 与 （1243)， 则在时刻 》 + 1 状 
态 （1234) 是不可能的.这样，关于在吋刻 （/? 一 1) 与 》 的状态的 
知识所传达的信息，要比关于在时刻《的状态的单一知识所传达 
的要多. 


*11 .杂 录 

( a ) 逆概率.虽然，最自然的是研究一个系统的将来发展，但 

* 初次阅读时本节可以略去. 
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有时也必需研究它的过去.考虑具有状态及不变转移概率 
的一个马尔科夫链，它在时刻„的绝对概率为 p ^. 
在已知系统在时刻〃处于状态的条件下，系统在时刻 m<n 
处于状态 E ; 的条件概率为（与时刻》以后的状态无关） 

-Cm) 

q ^ iin , m ) = m <. n . (11.1) 

这个公式仅当 > 0 吋才有 意义； 否则问题中的条件概率没有 
定义.如果所有的 4 B ) 都是正的，则（〗 1.1) 定义一组具有马尔科 
夫过程所需的一切性质的转移概率.特别， 叫 满足时间反 
向的查普曼-柯尔莫果洛夫等式（10.3)，即 

叫（》， w) = 2 q K vi.n, r) q vj {r, in) (11.2) 

V 

( m < r <«). h ;(«， m ) 称为逆概率特别，考虑一个具有平 
稳概率的不可约链.则对于所有的〜 4 n) = %，且々 > 0 
(参看第6节与第7节).在这种情况下，一步转移 q^in + 1, «) 
不依 赖于” 且可以简化为 • 

^ki ~ PiK - (1 U ) 

{^}是一随机矩阵，所以这里的逆槪率定义一个具有不变转移概 
率的马尔科夫链.如果？& = PiK > 则原来的链称为可逆的;它的概 
率关系在时间上是对称的. 

( b ) 中心极限定理. 循坏事件的理论包含关于马尔科夫链的 
进一步的知识.设为一个固定的常返状态，其循环时间具有有 
限的方差 oi (如果链是有限的，则这个条件总成立).设 N „ 为直 
到 吋刻” 为止系统经过 St 的次数.则由第八章第6节可知，变量 
N „ 是渐近正态分布的. •根据 本章的记号，_我们有 E ( N „) = 

= 在有限链的情况计算方差的方法将在下章中给出.特别， 

当„ —<»吋，对于任意的 s > 0, < s 的概率趋向 

n 
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于 1. 这是关于经过的次数的弱大数定律.类似，强大数定律 
与迭对数定律也成立，且无需特别的证明.在无限链的情况， e 4 
的循环时间即使有有限的平均值，也未必有有限的方差.然而，关 
于循环事件的一般极限定理在这种情况下适用 

随机变量 N „ 可以定义为 N a = X , + . •. + X „ ，其中当系统 
在时刻”处于状态时， X „ 等于1，否则等于零.这种表示 
有如下推广.我们赋予状态以任意的数值々，并且当系统在 
时刻” 处于状态时令随机变量 X n 等于和通常一样，我们 
令 S » = X + • • • + X B . 对于有限马尔科夫链，杜勒林 ™ ( W . 
Doeblin ) 曾证明，一般地说，中心极限定理和迭对数定律对于 S a 
成立.仅当数 A 选择得使对于每个由仏 返回以 的最短路径，6 
之和等于一个与路径无关的常数 c 吋，出现一个例外. 

( C ) 非随机矩阵. 本章的定理描述任意的随机矩阵 P [即其 
元素满足条件 (1.2) 的矩阵]的幂 P 1 的渐近性态.容易将这些结 
果推广到一类更一般的矩阵.设 P 是任一个具有非负元素的(有 
限或无限)矩阵，并用\表示其行和，即\ 我 ff 】 假定序 

列&有界，即存在一个常数使得\ < M . 在这些条件下， P " 
的渐近性态仍然由我们的定理来描述，这是因为 P 能化归为随机 
矩阵. 

为确定起见，设 P 的行与列从1开始编号，并且首先考虑对于 
所有的/，& < 1的情况.在这种情况，我们在 P 中加上标号为0 
的一行和一列而将 P 扩大，所增加的元素为/>00 = 1; />01 = /»02 = 

• • • = 0,且当/ > 1时九。=1 —心扩大后的新矩阵2是一随 
机矩阵，故它们渐近性态由我们的定理给出.另一方面， P ” 是 
的角元素乂?>的子矩阵.在一般情况，行 和乂可 能大于1,但这时 
我们可以用元素为 P lk / M 的矩阵 P * 来代替矩阵 P . P * 的行和邛 
满足条件 5 f <1,于是我们能够描述幂的渐近性态.然而， 
矩阵 P » 与户”仅相差一个因子所以我们的定理实际上在所 
有的情况都描述了 />以的渐近性态. 

在广义随机徘徊中遇到上述类型的矩阵. 
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( d ) 文献. 关于有限马尔科夫链有大量的文献.在 M . 弗雷 
谢” 的综合性论文中可以找到各种着手方法的详细说明和早期工 
作的文献.有限链的代数处理将在下章中给出.有限链的整个理 
论可由弗洛必宵斯 （ Frbbenius ) 的具有正元素的矩阵理论中 导出. 
这个方法特别被罗曼洛夫斯基 （ B . POMaHOBCKHS ) 所开拓.遗 
憾的是，这些方法不能应用于首先被柯尔莫果洛夫所考虑的无限 
链的更有趣的情况.他的工作被 W . 杜勃林 M 与 J . L . 杜勃〜所 
继续.钟开莱 [43] 特别研究了当某些状态被禁止吋，由一个状态到 
另一个状态的转移.德曼 M ( C . Dermdn ) _证明，在具有零状态的 
不可约链中，关于羊稳分布的方程 （6.1) 容有使得= oo 的唯 
—解反向公式对这样的解也有意义，并且近代理论日益关 
心类似的无界解的使用 [45] . T . E . 哈里斯 M ( Harris ) 系统地研究 
了与马尔科夫链有关的几类很一般的非马尔科夫过程. 


12.问 题 

1- 在伯努利试验序列中，如果第 》— 1 次与第《次试验的结果为《, 
则我们说在时刻》观察到状态 类似； E , 分别代表邛， FS , Ff . 
试求矩阵 P 及它的所有幂.推广这个概型. 

2. 将下列四个链的状态加以分类，这些链的矩阵 P 的各行分別给出如 
下.在每种情况下，求 P 及 Pf 的渐近性态. 

( a ) (0， i ， 士)， （ i ， 0， i )，（ i ， i ，0); 

( b ) (0, 0, 0, 1)，（0, 0, 0, 1), ( m ，0)，（0, h 1， 0); 

( c ) ( i ， 0， i ， 0， 0)， （去，全， i ， 0, -0)， （ J ， 0， 0， 0)， （0, 

0， 0， i )， （0， 0， 0， i ， 皆)； 

( d ) ( 0 , i ， i ， 0 , 0 , 0 )， （ 0 , 0 , 0 , 4 , 音>， （ 0 , 0 , o , I ， §， 

c . 1)， 0，0，0， Q， 0， 0)，（1， 0，0，0，0， 0)，（1， 0，0，0, 

、 0, 0). 

3. 在掷一颗均匀的骰子时，如果 7’ 是前〃次投掷中出现的最大点数，则 


1) 见 M. F.6chet [38]. 关于马尔科夫链的另一专著见 B. Mostinsky [39]. 

2) 见 A. Kolmogorov [40J, 
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我们说在时刻 《 系统处于状态试求矩阵 P " 并证明公式 (3.3) 成立. 

4. 在例 （2. 1) 中，试求从 E * 出发，系统分别在 E , 与£ 5 结束的(吸收 ) 
概率 h 与外(1= 2, 3, 4, 6). (童接从基本定义来解这个问题，而无需参考 
第8节的公式 _ 

5- 利用马尔_夫链来讨论第一章中的例 （5. b ). 计算每个赌徒获胜的 

概率. - 

6 - 设 P 的第一行为{朽，&，•••}.在以下各行中，= 其余各 
元素均为零.讨论各状态的特征;如桌平稳分布存在，试求之. 

7. 设？的第一列为{《》，… } 且 Pi,i + i = 1 — ? i (»_ = 0, 1，…）.试 
证明当且仅当2^ < CO 时，状态是非常返的.何时状态为零状态？如果存 
在平稳分布，试求之. 

8. 一个反射壁. 考虑如下的随机徘徊矩阵，其中 Pk ,^ = P , PM , k- t - ? 

(k = 2 , 3 , •••) 且/ > I2 = p , 试证明 \ 如果 p > q , 则状态是非常返 

的;如果？ = ?，则状态是常返零状态.试求平稳分布. 

9. 两个反射壁 .. 设链的状态为1, 2 ，…， 《，其转移概率矩阵的第一行 

和最后一行分别为 P , 0, …， 0) 与 （0, …，0, P ). 在所有其它各行 

中 i P *,* +1 = P , PM-i =4.试求平稳分布.这个链能否为周期的？ — 

10. 将 AT 个黑球与 W 个白球放人两个罐中，使得毎个罐有 W 个球.第一 
个罐中的黑球数为系统的状态.每次自每个罐中随机选取一个球，然后将选 
出的两个球相互交换.试求 P ;*. 证明在极限分布中项《*等于从由 W 个黑球 
与 N 个白球所组成的总体中任意选出的 2 V 个球中恰有 々个 黑球的槪率、 

11. 设链的状态为4，■^ ，… ，转移概率为 

叫一 SOP 反^， 

此处和中的各项当〃>々时应当用零来代替.证明 

. : 々！ * 

注.这个链在统计力学中遇到 [47] ,可解如下.系统的状态由空间某个 
体积.中的质点数来确定.在每个单位长度的时间间隔中每个质点离开该体 
积的概率为？，且各个质点是统计独立的.此外,新的质点可以进人该体积， 
且有个新质点进人的概率由普阿松表达式给出 • 于是平稳分布 


1) 这个问题要追溯到拉普拉斯;见弗雷谢的书 P 8]. 
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为参数为 "《的 普阿松分布. 

12. 爱伦弗斯特模型.在例 （23) 中，设初姶时第一个容器中有个分 
子，如果在时刻》系统处于状态々，则令 X<w = 2彳一《 (故是两个容器 
中分子数之 差）. 设 *• = ECX <*>). 证明 〜 +v = 0* — Zy n / a , 因而〜= (1 
— 2/ a )* (2; — a ). (注意：当”— 》 C0 时 e ，~>0.) 

13. 把第十三章例 （ l . b ) 中的计数器 | 司題作为一个乌尔科夫链来讨论. 

14. 具有反射壁的平面随机排徊.考虑在平面有界区域中的对称随机 

徘徊.边界在如下意义下是反 射的： 每当质点在自由随抑徘徊中会离开区 
域时，它总被迫使回到原来的位置.试证明，如果区域中的每个点都能由 
每一其它点达到，则平稳分布 存在， 且《* = 1/«,此处“为区域中的位置 
数. . 

15- 累次平均.设 … } 为一数列且 P 为一个遍历链的矩阵.试 
证明2 明 ,证明第十三章第4节及第十三章问题5中的累次 

平均程序是一个特殊情况. 

16. 在排队论中遇到链矩阵 


Po 

Pi 

Px 

p3 … 

Pd 


Pi 

P3 … 

0 

Po 

Pv ^ 

Pi … 

0 

0 

Po 

Pi … 


其中是 I 概率分布.利用母函数来讨论状态的特征.如果平稳分;布的 
母函数存在,^求之. . ' 

17. 吸收七等待时间.对于非常返伏态巧运为系统第一次转变为 
常返状态的时间.假定永远停留于非常返状态的概率为零，证明心= E(Y t ) 
是如下线性方程组的唯 一解： 

- 2 = 1， - 
、 r 

其中和是对所有使得 I 为非常返状态的那些《来求的.不过，< 不必是有 
限的. 

18. 设伏态数为《 < oo 且 E * 能由~到达，则它可经不多于 a 步而到 

达. . 

19. 设链包含《个状态 且巧: i 常返的.试证明存在一个数 g < i , 使 
得当 n > fl 时巧的 循环时间超过”的概率小于 V . (•提示：利用问题 18.) 

20. 在有限链中&为非常返状态的充要条件是，存在 £* 使得&能由 
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Ei 到达 ，而均 不能由 £* 到达.（如问题 7 所表明的，本问题中的结论对无限 
链不成立 .） - 

21- 有一个对角线上的元素为正的不可约链不可能是周期的. 

22. 有限不可约链为非周期链的充要条件是 存在” ，使得对于所有的 i 
与々有以 1 > 0. 

23. 在具有 fl 个伏态的链中设（\，…， * a ) 是线性方程组〜= 

的一个解. 证明： （0 使得 A >0的伏态构成一个闭(不必不可约)集； （ b ) 
如果 E , 与 E * 属于同一不可约集,财勺= A . 

24. (续上）.如果 （ A ， …， *«) 是〜 = - 的一个解(其中 M = 
1但 I / 1), 则存在整数 * > 1使得 V = 1. '如果链是不可约的，则这种整 
数中的最小暑是链的周期 • 

25. 平均遍 历定理 在任意链中 i 令 

吨> =丄乏 

n pTi 

如果 E ; 与 E * 属于同一不可约闭集，则趋向于一个极限，此极限与 y 无 
关且等于 《* (假定后者存在）.如果 E ; 与 E * 属于不同的闭集,则对于所有的 
», ^；；> = 0. 如果 E * 是非常返的,则对于所有的 7 , — 

26. 移动平均. 设 { Y *) 为相瓦独立的随机变量序列，每 个变置 以槪率 
1/2取值 ±1. 令 X <»> = ( Y , + Y , +1 )/2. 求转移概率 

朽 = P { X (*> =々| X ("> =/}, 

此处/«<»且込々= — 1,0,1. 证明不是马尔可夫过程且（1 0 . 3 〕 
不成立. 

27. 在伯努利试验序列中，如果第《 — 1与》次试验的结果为成功，则 
说观察 到伏态 E ,;_ 否则我们说系统处〒状态 E 心试求 》 步转 移概率 并讨论 
非马尔科夫 tt . 

注.这个过程由问題1、中的链通过将三个状态合并为一而得到.这种 
并合程序可应用于任何乌尔科夫链，而使马尔科夫性遭到破坏.在哈里斯的 
论文中研究过这种过程. 

28. 马尔科夫链的混合.已给状态数目相同的两个马尔科夫链，其转移 
概率矩阵分别为 P , 与由一个初姶分布及》步转移槪率 i />? + iPJ 定义一 
个新过程.试讨论新过程的非马尔科夫性及_其与第五章的罐子模型的关系. 

1) 这个定理是本章结果的一个简单 推论. 不过，它要简单得多，因此能用较简单 
的方法来证明;见 [#]. ' 
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* 第十六章有限马尔科夫链的代数论述 

在本章中我们考虑具有有限多个状态•••，&及一个给 
定的转移概率矩阵的马尔科夫链.我们的主要目的是导出》 
步转移槪率的明显公式.除了第3节中的一般概念和记号外， 
我们并不需要上一章中的结果. 

我们将利用母函数的方法并将由第十一章第4节中的部分分 
式的展开得出所要求的结果.我们的结果也能直接由矩阵的典型 
分解理论 1 >(反之，它们也能由我们的结果导出）得到.此外 3 对于有 
限链，第十五章中所证明的遍历性质可由本章的结果推出.不过， 
为简单起见，我们将对普遍性稍加限制，而不考虑那些使一般理论 
复杂化而在实际例题中不会出现的特殊情况. 

在第1节中概述了一般方法，例题在2、3 南节中 给出.在第 
4节中着重讨论了非常返状态与吸收概率.在第5节中理论被用 
来计算状态 A 的循环时间的方差. 

1.一 般理论 

对于每个固定的/，4我们定义一个母函数 

»= 1 

以乘上式并对/求和,我们得 

s 2 Pvi^ikO) —尸一 Pvk* 0-2) 

/«! 


氺本章讨论专门的论题，可以略去， 

1) 见弗雷谢的论文 [38 J . ' 
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对于毎个固定的々，这里我们有由关于〃个未知数•••， 
的《个非齐次线性方程所构成的方程组.理论上，这个方 
程组能用行列式或逐次消元法来解.我们仅利用如下 事实： 方程 
组的行列式是次数不超过《的多项式，而 PmO ) 则为以 DO ~) 
为公分母的 r 的有理函数.我们仅考虑方程 DO ) = 0无重根的 
情况; 这对一般性是一个轻微的限制,但我们的理论包括了具有实 
用价值的大多数情况. ' 

因为 P ^( s ) 是有理函数，由第十一章第 4 节的部分分式的展 
开可知，存在系数•••，“?，使得 

plf = + -+ …+ ( L 3) 

si 

此处 b …是 D { s ) = 0的根.如果 L >0) 的次数小于《，则 
(1.3) 所包含的项数小于 A 对于 v 与々的某些特殊值，分子与分 
母有一个或多个根&相同因而相互消去也是可能的.在这种情況 
§们令对应的为零. ' 

~ 根 A 与系数可用第十一章中的方法来计算，但利用马尔 
科夫链的某些特殊性质来计算更好一些.以巧-乘方程 （1.3) 并对 
v = 1，2，…求和，得 

V =1 I 

如果用（ I . 3 )表示上式左边，则我们得到一个恒 f 式，仅当两 
边4”，•••，的系数相等吋，它才能对所有的《成立.这意味 
着，对于固定的 r , 我们必须有 ■ 

a 

2j Pi»p^> r = 1, • • •, fl . (l-5a) 

v-i 

类似，以乘 （1.3) 两边并对所有的々求和，我们得 

0 

Pvk = -fr 2 P ^ Pkm . ( l -5 b ) 

k- l 

关系式 (1.5 a ) 表明，对〒固定的々与 r ， 《个量必，…，戍 
是如下“元线性方程组的解 


爷}. 0.4) 
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x'-p = S r p jv xl r} (/ = 1 ， …， O). (1,6a) 

V = 1 • 

类似，由关系式 （1.5b) 可知，对于固定的 > 与 r ， 义^，满 
足 “个线 性方程 ' 

a 

y { S = ^ S yVpkm (w = l, •••,«). (i.6b) 

.身； 1 1 

为了更好的理解，我们用任意的 f 来代替〜并研究如下两个 
更为 一般的 方程组 

a 

x , s=s '^i (; = 1, *••,«) (1.7a) 

w 革 1 

及 

a 

y, „ = ^ 2 VkPkm 0 = 1，…， 0). (l.7b) 

k = 1 

仅当其行列式为零时， 《 元齐次方程组才能有非平凡^解.现 
在方程组 （1.7a) 与 （1.7b) 的矩 阵除行列互换外是相同的.所以 
它们的行列式相等.此外， （1.7a) 的行列式显然等于方程组 （1.2) 
的行列式，这意味着当 r =心^， • • * ， L 时，两个方程组 （1.70 与 
(1.7b) 的行列式为零. 

现在我们可以不考虑母函数 P , k 0 ) 而将根&定义为使得方程 
组 （1.7a ) 与 (1.7 b) ^•非平凡解的那些数(实的或复的 ）. ^为单根 
的假设意味着，对于每个固定的 r， 除一个数值因子外解 W”， 

• • •，4 10 )与 （yi* 0 ，• • •，必是唯一确定的.不过，我们的出发点 
是，对于固定的々与 r， （说，…，必）是 （1.7a) 的一个解，而对 
于固定的”与 r， （必，…，必）是 （1.7b) 的一个解.因为这些 
解确定到一个数值因子，故我们必须有 

PV == c r xVy^. ( 1 : 8 ) 

剩下只需计算常数 h …， d 
由 （1.8) 与 （1.3) 我们有 


]) 照例，我们称恒等于零的解为平凡解，对于它我们不予考虑. 
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p,v = S 

r = 1 


0-9) 

所以 - 

P；^(0 = c L - H •. • + o 

Si — S 

s m 

(19a) 

利用 （1.6a) 由 （1.1) 可得 

2 = x V 2产:= 

1 n-l 

4 r) 

( uo ) 

• 

5 r — S 


另一方面，如果我们用（1也）来_左适的值，则我们导致分母为 
〜一 • ■? 的 a 个分式的一个和.由此推得，当 v ^ r 时分子必须为零 
且 ' 


1 = c r 2 4 r )yi r) ， (i n) 

v = l 

于是我们已求得〜我们已知，解4” 与 yW 仅确定到一个数值因 
子.不过，如果我们用 Ax ^ 代替砟’，用代替#，则 C , 将 
变成^而 （ L8) 中的量则保持不变. 

综上所述，•我们得到如下的计算 /4 n) 的 程序： 写出两个线性 
方程组 （1.7a) 与 （1.7b). 它们有共同的行列式且仅对 r 的使这个 
行列式为零的值有非平凡解.我们假定，根 •••（ 最多有《 
个)都是单重的 •，于 是对于每个 r， 解«>，•••，之>)与 
yP) 确定到一个任意的乘性常数.求出这些解并由 （1.11) 求出常 
数〜 于是虑 } 由 （1.9) 给出. 

对于每个固定的 r, 构成一个矩阵，它可以用如下的方法 
来构造.作出一个以为头一行、以 )4” 为头一列的乘法表 .用心 
乘这个表中的所有个元素即得矩阵 p 兄 为了构造矩阵 0!f)， 
我们必须用 < 除 p 泣的所有元素，并将这样得到的矩阵对 r = 1， 
2, •••，《**.注意，即使根的个数小于《，根〜也可能是单重 
的 .- 

重根的情况需要作某些改变但可用类似的方法来处理.最重 
要的情况将在第4节中讨论. - ' 
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在代数中，倒数 l 称为矩阵 P 的特征值(也秣固有值或特征根）. 

零是一个可能的特征值，但没有根 A 与之对应.这说明了为什么即使总有 
0个特征值而根 A 的数目也可以少于 a . 对于母函数的方法来说，使 用心比 
使用它们的倒数更方便一些.此外，它与积分方程论的一般习惯相对应，因 
而在概率论中更自然一些. ' 

值；=1总在 G 中出现，且 （1.7 a ) 的解^1,1，一,1)与之对应.对于 
所有的 5 我们有 U ,| >1. 事实上”，如果 Ul <1, 则根 kl 在 （1.3) 中 
会引起发散.如果/ = 1是使得 kl = 1的仅有根，则 — 容 

易证明，如果存在满足条件 k 丨=1的其它根，则它们必定是1的*次根， 
此处 < 为整数；在这种情况，链具有周期匕详细的讨论读者可参看弗雷谢 
的论文 [38]. 

通常要求出所有的根是麻烦的或者是不可能的.不过，渐近性态的 
一阶近似显然由满足条件 kl =1的 A 所确定，二阶近似则由具有下一个 
最小绝对值的根〜所确定 .. 

最;^ 的公式（ I . 9 )能用简洁的矩 阵记号 来表示.设 是其元素为 
的另 /向量 (或 a X 1 矩阵)，又设是其元素为^>的行向量(或 1 X a 
矩阵).则 ^ { r ) y ( r , 是其元素为的3 X fl 矩阵， 且（]. 9 )可写为如下 
形式 

4 

P n = 2 V ^"* X<f>Y<，> 其中 C = Y ( r > A ： <f, # (1.12) 

向量 X ( ’> 与 Y <” 称为待征向量 ， e 广为它们的内积. ^ 

, 2.例题 

( a ) 首先考虑仅有两个状态的链.转移槪率矩阵具有如下的 
简单形式 



其中0 </»<；!, 0 <« < I . 方程 （1.7 a ) 化归为 ^(1 - p) Xl + 
在押2 = A 及 ⑽ A + — «)h = *2. 使两个比值 xjx 2 相等，可、 

1) 直接的证明如下.设 M 为序列 •••, \ x ^\ ( r 固定)中的最大项•则由 
(1.6 a ) 有 iW < Url 2 p ; r>Ai = 或 卜，1 > 1. 
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以看出仅当^ = 1或 r = 1/(1 - a - p ) 时存在一个解.对应于 
St = \ 的解为（1， 1); 对应于^2 = 1/(1 — « — ?) 的解为（夕 5 
_«). 其次考虑方程组 ( l -7 b ), 现在它化归为 ^(1 - P ) yi + sa 
V : = yi 及+ r(l — C *) y 2 = y 2 . 我们知道，仅当^ h 或^ = 
^时它才能解出..对应的解为 （A />) 与（1， - D . 由 （1.11) 我 
们得 Ci = c 2 = \/ia + p ) : 现在方程 （1.9) 与 (1.11) 使我们能够 
写出量/>巧的明显公式.最后的结果能写成如下的矩阵形式 

〜 _L_f p ) + p 

a p \<^ P / a p ' — cc 认） 


(此处已将四个元素的公因子提出作为矩阵的因子). ~ 因为 u — 
、 一 pi < 1，故当” — m 时第二个矩阵趋向于零，而第一个矩阵 
则表示的极限形式 • 

( b ) 设 

r 0 0 0 1 1 . 


P = 


0 0 0 

i 丄0 
2 2 


( 2 . 1 ) 


L 0 0 1 0」 

[这是第十五章问题 2( b ) 的矩阵].方程组 （1.7 a ) 化归为 


^1 


欠3 


sx” x 2 = 

sCx x + y 2 ) 

* 2 ， 


叫， 


方4 = 


SX U 


( 2 . 2 ) 


因为乘性常数任意，故我们可令 A = 1. 于是 A = ^ A = 6 
r 3 = A q A 因此我们必 须有/ = 1. 现在如果我们令 > . 

6 = = cos — + / sin — 3 (2.3) 

3 3 

则/ = 1 的三个根为 h = i ， s 2 = e , s , - e \ (注 意： 即使有四 
个状态，我们也仅有三个根 •） 对应于这三个根的解为（1，1 ， I 
-1)，（ 0 ， 0 ，泛， i ) 3 (0 2 , e 2 , h 1). - 

由方程组 （ l -7 b ) 我们得 y , = sy 3 /2 9 y 2 = sy s /2 9 y 3 = sy 4y 
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y * = ^Cyi + yz ). 对应于 a == i 3 _ 巧 = 0 与 a =* 护的三组解为 （ 1 ， 
1 , 2 , 2 ), ( 0 , e , 2 , 26 2 ), ce 2 , e 2 , 2 , 20 ). 所以由（ 1 . 11 )有 0 = 
1/6, ^ = 1/(60 2 ) = 6 / 6 , Ci == 1/(60) = 0 2 /6. 现在我们能够表 
示所有的/^ . 例如， 


淖) 


1 十 e 2n+2 + d n+l 

3 


p u -> = 1 + e 2n+l + 


骞等 . 这个链显然是周期的，其周期为 3 . 

(C) 设 P + 亨 = 1， 

* 0 p 0 q 

q 0 p 0 

p = 

、- 0 ^ 0 P 

- - P 0 ? 0 


(2.4) 


(25) 


[这个矩阵描述了循环随机徘徊;见第十五章例 (2. d ).] 方程 (1.7 a ) 
化 归为* ^ = ^(^2 + qx ^, x 2 = s ^ qx x + px ^), = siqx 2 + px^) t 

r 4 == sipxx 4 -和 3 ). 假定 p ¥= q . 由第一个与第三个方程我们求 
得 ^ = ■$(>2 + ☆)，由其余两个方程有 x z + x 4 = H - rj ). 

所以我们有 P = 1 或 A + A = A + A = 0. 在第一种情况有两 
个根 ^1 = 1, ^2 = — 1. 另一方面，.以 ^3 = — ^1> X A = — X 2 代入 
前两个方程，我们有 s \ P - q y =~ 1 ,由此可得另两个根巧与 
、于是 

A = 1，= —1，^3 = --- t -- — - ， (2.6) 

q — p q — P 

(此处 ^^一；! 乂 对应的解包含一个任意的因子，故我们可 
令# = 1. 于是容易求得四组解为 （1, 1, 1，1)，（一1，1， 一 1， 
1 ), 0 , — 1，一/，1)， (-/, — 1， i ，1). 在我们的情况方程组 
(1.7 b ) 化归为 h = siqy 2 + pyd , Ji = ■Kpyi + qy >), y 3 = sQpy 2 -)r 
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^y<)> yt. — Kqyi + pyi). 对应于 (2.6) 中的四个根的解为（1， U 
1,1), (—1，1，一1，1)，（一/， — 1, O, (/, — 1, — /， 1) .对 
于常数我们由 （1.11) 求得 q = c , = = 1/4. 利用 

U.3) 与（1.8)，现在对于每个序列 p ) V(n = 2» 3, ••-) 我们能 

写出一个明显公式.在现在的情况，解玲 ; 与 yW 具有简单的形式 
(o, a 2 , «% a"), 此处是四个数1， 一 1， 》' 或 一i 之一.这使我们 
能够用简单的公式来表示 

攸 =丄 {1 + (? — + (-1)^-"}. (2.7) 

4 

这个公式对于 p *= ? = 1/2也成立. 

可以看出，包含 （？ 一 的项趋向于零，其它的项则果有周 

期 2. 

(d) 一般的循环随机徘徊[第十五章例 (2.d )]. 在上个例子 
中我们能将砵)与 yt 表示为1的四个四次根的幂*这启发我们 
对第十五章例 (2.d) 中的一般矩阵试用类似的程序.将状.态从0 
到*一1来编号是便利的.为简洁起见，我们令 

9 = e t,nU . (2.8) 

这是1的一个《次根，且所有的《次根可用序列1，0，&，•*•， 
0 a _ l 来表示.容易看出，方程组 （1.7a) 与 (1.7b ) 有如下“组解 

= 6 r >, yi r) == 6 - rk s (2.9) 

其中 r = 0, 1，2, …， _ 1; 它们对应于 

Sr = A 01 ’"} * (2.10) 

由方程 （1.11) 与 （2. 9 ) 可知，对于一切》•有于是最后 
有 



对来验证这个公式是有趣的.办的因子为 

m ' 2 ( 212 ) 

r = 0 " 
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当；一 々 + V = 0 或《吋，和中的每一项等于1;对于所有其它情 
况，此和为零.于是，如果 A > /，则化归为 q k - y \ 如果々 < 八 
则声货化归为 q a+k ~^ 而这就是所给的矩阵 a 

( e ) 占位问 ■. 第十五章例 （2. g ) 表明，古典占位问题能用马 
尔科夫链的方法来处理.如果有/个盒被占据 、“一 /个盒空着， 
则系统处于伏态如果这是初始情况，而另有《个球被随机地放 
人盒中，则为将有々个盒被 占据、 々个盒空着的槪率（因 
此如果 々 < /，则== 0). 对于丨 = 0这个概率由第二章中的 
公式 （i 1 .7) 得到.我们现在导出的公式，因而推广第二章的 
结果. 

因为心 Pi.i+1 = (.a — o / a , 故容易看出，方程组 
(1.7a) 化归为 

(a — ， /) 々 == — j)x i+l ，;' •= 0, * • a. (2.13) 

对于 f = 1 我们得 到解巧 = 1. 显然，如果 S I , 则= 0, 故 
^ = 1是使得所有的： T , 异于零的 f 的唯一值.如果$是使得 
(2.13) 有解的任一其他值，则必须存在某个足标 r < «, 使得: r, +l 
= 0 而* V # 0;于是由 (2.13) 可得 yr = fl . 因而使得 （2.13) 有 
解的根〜为 A = «/ r(r = 1, 2, - • a ). (2.13) 的对应 解可依 

次令老=1及/ = 0,]，…而得.我们求得 




(2.14) 

故当/ > r 

吋 r” = 0. 

. 、 u, 

对于^ 

方程组 0.7b) 化归为 



( r _ ；)y<r) = («—； + 1 VA， 

(2.15) 

其解为 

y 卜（: = :) (-1) 卜 r ， 

(2.16) 

这里，当然当/ <，吋汴)= 0. 因为当 j> r 

吋 4 10 = o 而当 


7 < r 时以> = 0,故由方程 （1.11) 我们容易求出 G = (4 r Yr r) ) 
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=(:)， 因此 

晚 Km:x;)c:)(—(;)• ⑽) 

用阶乘来表示二项式系数，这个公式可简化为 

成 )=( 二:) ■(书 " ㈠ )… f :，)， ㈣ ) 

如果々< /， 则/^ == 0. 

(进一步的例题可在以下两节中找到 .） , - . 

3. 具有反射壁的健机徘徊 

现在我们通过详细讨论具有状态 . h 2, • • •， 《及两个反射壁 
的随机徘徊来说明马尔科夫链的应用 1 矩阵 P 的第2, 3 ,，••， 
« — 1行由= />及/^叫= 7所确定;第一行和最后一行分 
另 1 :为（?， P ， 0, • . •，-0)，（0，…，0, 令 ，户)..当5= 1时第十五章 
例 (2.C) 的矩阵简化为这个矩阵.用随机徘徊的术语来说，/>史是 
由 . ^ == /出发的质点在时刻 w 位于 * — k . 的概率. 

方程 (1.7a) 取如下形式 

X ] — s (^ qx x + px ^) 

Xj = siqXj-x + px i+i (；' = 2 } 3, • • o — 1) (3.1) 

Xa = S^qXa-i + pXa). __ 

这个方程组对应于 f == 1 的解为 A = 1. 为求所有其它的解，我 
们应用特解方法(在第十四章第4节中我们已将这个方法应用于 
类似的方程）.如果; I 是二次方程 X = qs + Vps 的一个根，则 
(3.1) 的中间的方程被~ = V 所满足.这个方程的两个根为 


1) 以下的部分计论是第+四章中的理论的重复.我们的二次方程在第 -卜四 章中作 
为 （4.7) 而 出现； 量; 1,0) 与 10) 曾由 （4.8) 给出，一般解 （5.3) 在第十四章 
中则作为（4. 9 )而出现.这两种方法是有关联的，但在很多地方计算的细节根 
本 不同. 
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AO )= 



LO ) 




(3.2) 

所以 (3.1) 中的中间的方程的最一般解为 

x , = + 500^(0， （3.3) 

此处 Z 0) 与 B ( s ) 是任意的. （3.3) 满足（ 3 .1)中的第一个与最 
后一个方程的充要条件是 A = A 且* '« = * Vh ._ 这需要 Z 0) 与 
B ( s ) 满足如下条件 

j(0{l — Aj(0} + B<i){l — 又 2 (j)} = 0 ， 

^0)^0){1 + B 0)«0){1 - h 0)} = 0. - (3.4) 

不过，仅当 

X a , Q ) =* 1 ^ 0 ) . (3-5) 

时，这两个方程才是相容的，于是我们必须确定 f 的值使 (3.5) 成 
立 ■ . 

由定义 (3.2) 我们有 10)1(0 =《/?，由 （3.5) 可知， A 心） 
0 / 9 ) +与 Z 2 ( s ) { p / q)i 必须是1的 h 次根.这些根能写成如下 
形式 


utr . • • «r 

cos - f - i sxn ——， 

a a 


这里 — i r = 0, 1，2,…， 2 fl — 1. 于是 （3.5) 的所有解 
在 ' 

A ( f ) =(爹) 2 e , Wa ，又 2(0 = 《爹) 2 e ~ in,,<, 


的根之中. 

对于每个值『我们能求得一个根〜即 

s r = {2{pq)^ cos jrr/ a}~\ (3.7) 

值 r = a 必领除外，因为对于它 AC 0 = W >)，^0) = — B ( s ), 
故它导致平 凡解巧 s 0. 对应于 r = 0 的解为 ^ = 1, 这个解我 
们已予考虑.对于 r = 1 , 2 , • • •, a _ 1，有 a — 1个不同的解 
与之对应;如果我们令 r = a + \, a + 2 , • • 2 a — 1 ,则我们 
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得到相同的解，其中 A0) 与 1 2 0 ) 互换.这样我就已求得 (3.1) 
的“组不同的解，且我们知道，不可能有更多的解. 

对于/ = 心 0 = 1，2, •••，《 — 1)，由 f 3.4) 可得 2^0) = 
1 — LG) 及 2 B ( s ) = - {1 - M0)}. (记 住： 乘性常数保持任 
意 .） 代人（3.3)，我们求得 《 — 1 组解 

xT = (■)%々_ [^ f U+1 \\n (3.8) 

0 = 1,2, •••，《 — 1). 将前面已求 得的鮮 

xf = 1 (3.9)" 

添加到这组解中.容易验证 （3.8) 与 (3.9) 表示已给方程组 (3.1) 
的解. 

现在我们必须求第二组线性方程的解.在现在的情况, (1.7b) 
取如下形式 

Vt *** sqiyi + Vi)j 

+ a々+i)，(^ =» 2, • • -,fl — l) (3.10) 
y « *= ! P ( y a —1 + y «). 

将 p 与 g 互换后中间的方程与 （3.1) 是一样的，故它的一般解可 
由交换 （3.3) 中的 P 与？而得.如果 f 则第一个与最后一个 

方程能被满足，用简单的计算即可证明，对于 r = 1，2, • • •， 《 — 
1， （3.10) 的解为 

(♦)“ sin^ - (f)^ 13 si ， 气二 」 (3.11) 
对于， =1可类似地求出 

处)=(】-)々. 0.12) 

■•下一步在于计算 （1.11) 中的系数〜如用倍角的余弦来表 
示 sin 2 nri/a 并利用复指数，则求和可以简化.于是我们只须求有 
限几何级数之和，容易求得 

c r — ^ ■ 1 — 2( 何)吾 cos (r = i ， 2，’ • • ，0 一 l) f (3.13) 

a k a ) " 
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对于 r = Oj 如果 f _ < h 则我们得 


如果/> = ?= 


r = q ( p /^ ~ 1 

a p ip/qY - 1 * 

1/2,则 （3.13〉 仍保持有效，但 （3.14) 要用 q 


(3 14) 
= 1/0 


来代替. 

这些公式导致最后的结果 



( l / iLr 丄(?\ 
ip/qY — 1 Vg / 


+ 






(3.15) 


其中&代表 


7 trj 




»rr(^—l)i 


— 2( K pq')^ cos — 


当”- * CO 时， (3.15) 中的第二项趋向于零，故趋向于不依赖 
于/的平稳分布.（这个极限分布可用其它的方法导出，参见第十 
五章问题 9 . ) 令 “ — 00并取极限，我们就得到具有单一反射壁的 
随机徘徊的 公式; 在取极限时 9 和式被一个积分来代替1 


4. 非常返 状态; 吸收槪率 

第1节的定理是在根〜 h ，• • • 互不相同的假设下导出的. 
对于存在重根的情况并不需作本质的修改，但我们仅讨论特别重 
要的一个特殊情况.每当链包含两个或多个闭子链时，& = 1是 
重根，这种情況在与吸收概率有关的问题中经常出现.容易修改’ 
第1节中的方法使它适应于这种情况.为简单明了起见，我们将 

1) 对于在具有一个反射壁与一个吸收壁的情况的类似公式见 M. 卡斯 f49J. 在 
那里对反射壁的槪念作了修改，使得质点可以到达 0. 每当这种情况出现时，质 
点在下一步就回到 1. 在这种情況，明显的公式比较复杂 • 卡斯也求出了愛伦 
弗斯特模型[第十五章例 （2.f)j 中关于 W 的公式 . 
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通过例题来说明这个程序，这些例题将揭示一般情况的主要特征. 

例. （0 考虑转移槪率矩阵 


1 2 

— — 0 0 0 0 

3 3 

—- 0 0 0 0 

3 3 


0 


0 


0 


P 5B= 


0 J J ° 


(4.1) 


1 1 

— 0 — 0 

4 4 

1 t 1_ _1 x .L 

1 - 6 6 6 6 6 6 - 



显然，艮与构成一个闭集(即不可能由它们转移到其它四个状 
态中的任何 一个； 试与第十五章第4节相比较).类似地 ，坞与 


艮构成另一闭集.最后， E 5 与艮为 非常返状态.在有限步以后 
系统进人两个闭集之一并停留在其中. 

矩阵 P 具有 分块 矩阵的形式： 


A 0 0 

P B = 0 B 0 

U V T 


(4-2) 


此处每个字母代表一个二阶矩阵，毎个零代表由四个零组成的矩 
阵.例如， J 具有行 （ i ， I )与 （ U ); 这是对应于由两个状态 
与 艮所 构成的链的转移概率矩阵.这个矩阵可单独地加以研 究，’ 
•而幂#则可由在例 (2. a ) 中令 p = « = 2/3而得到.在计算幂 
P 2 , P 3 , •• •时，我们将看到，前两行决不受其余四行的影响.更精 
确地说， P " 具有形式 


^"00 

P = 0 S " 0 , (4.3) 

Pn V n T'\ 
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这里 j "， B ' P 分別为枣 B 与:^^的》次幕，且能用第1节的方 
法来计算 15 (参见例 (2. a ), 在那里所有的计算都已完成）.代替六 
个六元方程，我们所面临的是各包含两个方程的二元方程组. 

应当 指出， （4.3) 中的矩阵仏与匕不是 C 7 与 P 的幂,因而不 
能用像求与; 7- 那样简单的方法得到.在计算 P 2 , P % • • • 
时，第三、四两列决不影响其余四列. 换句 话说，如果在^中将对 
应于 E s 与£ 4 的行与列删去，则我们得到矩阵 

， n <4 .4) 

\ U n T n J ' 

它是 P 中的对应子矩阵 

---00 

3 3 

2 -丄 0. 0 

3 3 

(4.5) 

丄 0 丄丄 

4 4 4. 

丄 J _ 

6 6 6 6 

的》次幂.所以矩阵 （4.4) 能用第1节中的方法来计算，在现在的 
情况这种方法大为简化.矩 阵匕可 用类似的方法得到. 

通常与 R 的明显形式仅由于它们与吸收概率有关才具有 
重要性.设系统从，比方说，£ 5 出发， 试问： 它最终将进人由民与 
& 所构成的闭集（因而不进人其它闭集）的概率; L 是什么？这个 
事件恰好在第”步出现的概率 L 是什么？显然， /4 B) + 是所 
考虑的事件在第 〃步或 在此以前出现的概率，即 

+ p\f = A + \ + ... + 儿„. 

令《 —00,即得; I . 计算怂的一个较好的方法如下.第步 
必须使系统处于异于^与 E 2 的一个状态，即处于£ 5 或 E〆 因为 

]) 在 t 中行和不为1,敌 r 不是随机矩阵.不过，除 f = 1不再是一个根（故 r " 
•> o ) 外，第1节中的方法无需改变就可应用. 
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由 E 3 或 E 4 不可能转移到 与 E 2 ). 然后第《步使系统处于氏 
或所以 

K = Pn~ l Kpii ■+■ Ps) + + 

==- pir° + -- pm\ ( 4 . 6 ) 

4 3 

K 完全决定于的元素，且这个矩阵容易算出.在现在的情况 

^^~ (^) b 1 因而 ― ^ 1 • 

⑻ 兄妹交 K . 作为第二个例子我们给出第十五章例 （2.1) 
的详细讨论.容易看出，艮与 E 5 各构成一个闭集(从生物学上的 
意义来看这是一个明显的事实).如果系统从任一个其它状态出 
发，则它最终将进入&或£ 1 并停留在那里.饲养员想要知道对 
应的概率及过程持续时间的期望值. 

删去第一、五两行与第一、五两列，我们得到简化后的矩阵 

ol 


8 . (4.7) 

0 

0 _ 


T 




4 4-1 




4 2 


0 10 


现在可用第1节中的方法来计算幂它们表示非常返状态中的 
转移槪率. 

方程 （1.7 a ) 化归为 


s(2x x 4 - x^) 

3 

4 

s(x 2 4 - 2 私） 

, s 

斗 


5(2;ci + 2x 2 + 2xj + x^) 
8 ’ 


( 4 . 8 ) 


这组方程仅当行列式为零时才有解，而这个条件则导致关于 J 的 
一个四次方程.为书写简单起见，我们令 
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^ = 5 ? — 1 , = 5 ? + 1 . 


( 4 . 9 ) 


于是四个根&为 

Ji == 2, s t =4, = 0, ^4 *= — 6 ti (4.10) 

而 (4.8) 的对应解 Of ，…， #) 为 

(]，0，一1， 0), (1， 一 1，1， —4), 

1>0D, (I, - e 2> 1, 60. (4 10 

关于 yP 的线性方程组可通过特殊化而得到.由 （1.7bX 四沮解 
为 

(1,0，一1，0)， （1» —1， I ，一1/2)，. 

( 1 ，0” 1，识/8)， （1， - e 2 , 1, (9 j /8). (4.12) 

由（1，11)我们求得四个常数= 1/2, 6 = 1/5, r s «9〗/40 # 
^ = 0:'/40.由 (1.8) 我们得 pH 最后，对于所有的非常返状态， 
即对于 y ， 々= 2, 3, 4, 6, 由 （1.3) 给出.对于固定的/， 令， 
序列是公比为〜•••，〜的四个几何级数的和. . 

仅当第《 — 1使系统处于 民或& 而第"步使系统处于 A 
时，才有可能恰好 于第” 步在艮吸收.这个事件的概率为 心1 
4 -f- 类似地，在 E 5 处吸收的概率为 Pir°/16 -4 - pT °/ 

4. 对所 有的” 求和，我们分别得到系统最终将到达并停留在艮与 
&的槪率.这些槪率的实际计算仅需对四个几何级数求和. 

5. 在循环时间中的应用 

在第十三章问题19中曾指出，循坏事件#的循环时间的均 
值〆 与方差/能用# 在第” 次试验出现的概率来计算.如果 
#不是周期的，且/有限，则 

如果我们把一个常返状态玛看作是名，则《„ = P ( f ( u 0 == 1). 
因为在有限马尔科夫链中所有循环时间具有有限的方差（参看第 
十五章问题I 9 )，故 （5.1) 可以应用.设 A 不是周期的且公式 
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(1-3) 成立. 于是 〜=1 且 Url > 1 (， = 2, 3, …） ，故沿 )-»• 
p )? ~ l / ft . 公式 

t\f — — = P f u s ~ n (5.2) 

与 （5.1) 中的项〜 ~ l / p 相对应.这个公式当 》>1 时 成立； 求 
公比为的几何级数的和，我们求得 

S W - -) = S ~^T. (5.3) 

.«=1 \ 户 〆 r=2 S r — 1 

将此式引人（5.1)，我们 得到： 如果£,是非周期常返状态，则其 
平均循环吋间由,《,_ = 1/通 5 给出，循环时间的方差则为 

«rj = fi, - fi) + 2^ 2 (5.4) 

r=J Jr — 1 

当然，我们假定公式 （1.3) 可$应用且 A = 1. 在周期伏态的情况 
及出现重根时，只需作一些的修改. 
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第 + 七章随机过程初步 G 

1 .一 般讨论 

随机徘徊与马尔科夫链是仅在固定时刻，比方说/ = 1,2,3, 
• • • 发生改变的随机过程.另一方面，在第六章第5, 6两节中， 
我们已 涉及到象电话呼唤、放射性蜕变和染色体的分裂之类的现 
象，其中变化可在任何时刻发生.显然，这类过程的完全描述超出 
离散概率的范围.为确定起见，考虑一个电话交换台收到的呼唤 
(倒不如说是实际过程的一个理想化的数学模型).每个时刻 V 对 
应于一个试验，一次实验的结果可用给出直到吋刻 * 的呼唤数的 
一个函数 X 0) 来描述.如果第一次呼唤 fe 吋刻 A 出现，第二个在 
t 2 , 等等，则函数 X 0) 当0 < ^ < A 时等于0,当/, < * < 6时等 
于 U 当吋等于2,等等.反之，每个仅取值0，1，2, 
••- 的不减函数 X (0 表示在我们的电话交换台处的一种进程.换 
句话说，我们的理想实验的完全描述需要以函数 XO ) 为样本点的 
一个样本空间（在离散试验的情况样本点为一序列).象“在某天 
的一分钟内有7次呼唤”这样的一个复合事件显然是满足如下条 
件的 XCO 的一个 集合： 对于指定区间中的 某点/ 有 X (/ + A ) — 
XCO > 7,其中 A 表示一分钟的长度. 

这里我们不能考虑这样复杂的样本空间，而必须推迟对理论 
的更精的方面的研究.幸运的是，对于某些有趣的问题，用简单的 
方法就能加以回答 • 

如果我们限制考虑任意固定的长为、的一段时间内的呼唤数 
XG )， 则 XC /) 是取值0,1，2, * • • 的一个具有熟悉类型的随机变量. 


1) 本章几乎与第 H 十六章无关. 
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设为 X (0 - «的槪率.诚然这时分布 { p .( r )} 依赖于一个 
连续的参数，但本书所引人的大多数分布都是这样. 

这种情形最好用普阿松分布 ^ 

( 1.0 

»! 

来举例说明.它曾在第六章第5节中作为二项分布的极限分布而 
导出； 在第十二章第3节中包含有一个更令人满意的推导.我们 
将不利用那章的结果，但那里所分析的情况是如此简单和典型，所 
以一个简短的总结可作为本章的一个最好的导言. 

考虑用整值随机变量 X (0 > 0所表示的一个随机过程.直 
观上我们可将叉⑺解释为，比方说，雷电所造成的以元计的累积 
损失.如果引人如下两个简单的假设，则可得出一个特别简单的 
数学模型.从0到/ + £的时间间隔内的增量 X (/ + y ) — X (0) 
是对应于从0到 * 与从£到 * + £的子间隔的增量 X ( s ) — X (0> 
与 X ( / + /)- X ( s ) 之和.首先我们假定这些增量是统计独立 
的，其次假定 X 0 + 0 — X 0 ) 的分布仅依赖于/ (即仅依赖于间 
隔的长度，而不依赖于它的 位置： 这是对时间的均匀性). 

设 A „0) 为 X(z + — X ( s ) 取值》(此处》= 0, 1，2,， .♦) 

的槪率.解析上，0 — XO ) 与 XO )- X (0) 的独立性用 

n 

hjj 4- f) = A ,(，）• 0*2) 

来表示.在第十二章第 3 节中已经证明，具有性质 （1.2) 的唯一分 
布 { UO } 是复合普阿松分布;即 xo ) 具有随机变量 

Sn (其中 P{N = »}= (1..0 

的分布，此处 s „ = Y , + +…+ Y „ 为个具有共同分布 

{/,}(/= 0, 1, 2, ** •) 的独立随机变量之和.在我们的例子中， 
{/;} 表示个別雷击所造成的损失的概率分布； （1.3) 表明，在长为 
* 的时间间隔中的击中数服从普阿松分布 (1.1), 且&次 损失是 
相互独立的随机变量.变量 （1.3) 与任意长为*的时间间隔内的 


变化 x (/ + 0- X 0) 具有相同的分布，又我们看到，这个总变化 
是随机个 （ N 个）个别变化或跳跃之和.变化的数目 N 具有普阿 
松分布（1.1)，而个别的跳跃具有概率分布 {/,}. 特别，普阿松分 
布 （1.1) 本身表示所有的跳跃具有单位长度(即/ 1 = 1，/。= / 2 = 
-^ 0,变量 Y „ 仅取值1 ) 的特殊情况. , 

读者一定注意到，我们已通过内在的概率性质求得简单和复 
合普阿松分布的一个特征.普阿松分布不再作为其它分布的一种 
近似或极限形式出现，而是根据它自身的性质而处于独立的地位 
(或者可以说，它表达了一种物理定律).它的推导具有纯粹的分 
析特征，随机过程的概念和随机变量 X (/) 仅用来得到关于分布 
队0)}的 一组看来合理的假设.在很多应用中仅需要关于 认(/〕} 
的知识.从理论上说，应当证明， { kXt )) 确实决定一类随机变量 
X 0) 以及所有象事件 “ X 0) 总要超过^ 的概率(这是保险 

中的集体风险理论的输光问题)那样的有关概率关系. 

这种类型的问题超出本书的范围.我们将满足于将过程的物 
理描述解释为只依赖于基本概率 p „(/) 的某些性质，并把 p n 0) 看 
作是依赖于 * 的一类离散概率分布. 

这种局限于离散槪率的人为限制， 有不可 避免的缺欠.例如， 
考虑 （1.1) 中的零项.我们将 


PoCO = (1.4) 

解释为在长为的一段观察时间内没有呼唤出现的概率.这个说 
法显示出， PoCO 可以解释为直到第一次呼唤的等待时间(从一个 
任意的吋刻开始)超过 * 的概率.可以证明，这个解释是正确的， 
但要注意，它牵涉一个连续统的槪率.我们的第一种说明的操作意 
义 如下. 作具有固定观察时间 * 的一系列“恒等的观察”.每次试 
验的结果为"无呼唤”(成功)或“有一个或多个呼唤”(失败).于是 
. 我们得到成功概率为的伯努利试验.第二种解释是，我们一 
直等待到一个呼唤的来到.每个正数都是一个可能的等待时间， 
所以对应于每次试验的样本空间是半直线/> 0. 于是公式 （1.4) 
表示一个连续的概率分布. 
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2 .普阿松过裎 

首先我们给出普阿松分布一种新的 推导； 它决不比前面所叙 
述的推导更好，但它对我们将要研究的各种推广更适合. 

考虑由于象物理质点的裂变、电话呼唤的到来或在有害辐射 
下染色体的分裂之类的随机事件的出现而发生变化的系统.假定 
所有的变化具有同一类型，且我们仅考虑它们的总数.每一变化 
用吋间轴上的一个点来表示，所以我们是在研究直线上点的某种 
随机分布. ~ 

我们所考虑的物理过程可用如下两个性质来 刻划： 它们在时 
间上是均匀的，且未来的变化与过去的变化无关.这意味着，确定 
过程的力保持绝对不变，所以对于长为 r 的所有时间间隔，任何特 
殊事件的概率都相同，.而不依赖于这个间隔的位置及系统过去的 
历史' 

,现在我们将这种说明翻译为数学语言.过程可用在长为/的 
时间间隔中恰有”次变化出现的概率来描述.特别， P 0 ( r ) 
是无变化的概率，1 一八 (/) 为有一个或多个变化的概率.我们假 
定，当式― £) 时有 3 ) 

匕产)一 X ， ( 2 . 1 ) 

此处 A 为常数.于是，在长为 >4的小间隔中有一个或多个变化的 
概率为1 一 PoQ ) = W 其中 o ( A ) 表示阶低于 A 的阶的 


1) 在电话交换台中，在一天最繁忙的期间来到的呼唤比，譬如说，半夜12 点与丨点 

之间要更经常一些；因此过程在时间上是不均匀的.不过，显然电话工程师所 
关心的主要是一天的“繁忙期间”，在这朗间中可将过程看作是均匀的.经验也 
表明，在繁忙期间中来到的流惊人搐确地服从普阿松分布.类似的考虑可应用 
于汽车弯故，它们在星期天中更经常一些,等等. - 

2) 对于非由匀过程，我们必须引人在间隔 t ,< t < h 中 出现” 个变化的概率 

W. ， 6)_ - 

3) 这个假 S 可以省略，见第6节， _ 

- 43^ • 



量.现在我们来确切除述我们的 

关于普阿松过程的假设. 不论在（0, 0中变化的数目怎样， 
在 （G f + A) 中出现一个变化的概率为 ilA 4* oW , 而且出现一 
个以上的变化的槪率为 oCh ). 

由这个条件容易导出关于 PM 的一组微分方程.考虑两个 
邻接区间（0, /) 与（/， z + A)， 此处 A 很小.如果《 > 1，则在间 
隔< +幻出现"个变化恰有如下三种互不相容的 方式： U) 
在（<，< + O 中无变化，而在（0, 0中有》个变比； （2) 在0, 
/十 A) 中有一个变化，而在（0, 0中有《 — 1个变化； （3) 在0, 
/ + A ) 中有 * > 2个变化，而在（0, £) 中有》— ^个变化.按照 
我 f 门的假设，第一个事件的槪率为 PXt ) 与（/， r 十中无变化的 
概率(此概率为 I —U — c(A)) 的乘积.类似，第二个事件具有 
概率 P„-MXh + o(A), 而最后一个事件的槪率则是其阶低于 >5 
的阶的量.于是我们有 

P-0 + A) = P„(/)(l - Xh} + PdCOM + o(X) (2.2) 

■或- 

= — XP a di ) + AP„- 心）+ (23) 

h h 

&当 A — 0时，最后一项趋向于零 >所以左边的极限°存在，且 
P；(0 == - IPnit ) 4- lP n -M (» > 1). 

对于》==0,以上提到的第二个和第三个事件不会出现，故（2..4) 
被如下的较简单的方程来代替： - 

P 0 (< 十力）= ^0)(1 — 又 A) + oQi )， (2.5) 

由此得 

KOI = — (2.6) 

由 （2.6) 及 Po(0) = 1我们得 PoO ) = d 以这个& (0 代 


1) 因为我们艰 制 A 取正值，故 （2.4) 中的 P ；(0 应解释为右导数.它实际上是通 
常旳双侧 争数.事 实上， （2.2) 中的项不 依赖于 /, 故当 i 一/■代替 /时保 
抟不变.于是 （2.2) 蕴涵连续性，而 （2.?) 内蕴涵通常意义下的可微性.这一 
附注适甩于笼个本章内容，以百不再 a 复. 
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人 (2.4) (« = 1), 我们得到关于 PM 的一个微分方程.因为 
^,(0) = 0,故我们容易求得广0) = u e -* 这与普阿松分布 (1.1) 
一致.用同样的方法，我们依次可求得（〗.〗）中的所有项. 

3.纯增殖过程 

在普阿松过程中，在0, * +約中出现一个变化的概率不依 
赖于 （0, 0中的变化数目.放弃这个假设便得到一种最简单的推 
广.代替这个条件，我们假定，当（0, 0出现"个变化时，在0, 
t + h ) 中出现一个新变化的概率等于与阶低于 A 的阶昀项之 
和; 刻划过程的单一常数 a 被序列又》1， ••- 所代替. 

引入一个更灵活的术语是便利的.如果在（0, 0中出 现”个 
变化，则我们说系统处于状态于是一个新的变化成为一个转 
移 — E 〜. 在纯增殖过程中，由 E •仅能转移到这样一 
个过程由如下的假设来 刻划： 

假设. 如果在时刻 * 系统处于状态 E a (« = 0, 1，2, •••)， 
则在0, * + A ) 转移到 E n + l 的概率等于+ 0 ( A ); 任何其它变 
化的概率为 odk ). 

这个假设的突出特征是，系统在任何特殊状态所花费的时间 
不起 作用； 只要系统停留在单一 状态， 就会有状态的突然改变而不 
会有老化现象. 

再次令 P n CO 为在时刻£系统处于状态 E s 的槪率.函数 p „0) 
满足一组微分方程，它能用上节中的方法导出，仅有的改变是用 
p „0 + A ) = P „0)(1 - Kh ) + + o ( A ) (3.1) 

来代替 （2.2). 用这种方法我们得到基本微分方程组 
P ；(0 = - KPn (. i ) + A B _ 1 P o _ l (0 in > 1), 

Po (0 = - Mi ). - (3.2) 

我们能首先计算巧0)，然后依次求出所有的 PnO \ 如果系统的 
状态表示（0, 0中变化的数目，则初始状态为 S 。， 故朽 (0) = 1 
因而 Po ( f ) = e 不过，系统不必从状态 E 。 出发[见例 （3. b )]. 
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如果在时刻零系统处于 E ;， 则我们有 

pXo ) = i ， p a ( o ) = 0 (» # 0. (3..3) 

这些初始条件唯一地确定 （ 3 . 2 ) 的解 { pxt )). (特别 ， nco = 
p ,0) = -••«= Pi-.co = o .) 关于 p „(0 的明显公式已被很多作者 
独立地导出，但对我们并无重要关系.容易验证，对于任意指定的 
K , 系统 { P „(0} 具有全部所需性质，只是在某些条件下 2 X 0)< 
1.这、个现象将在第4节中讨论. 

例 . 00放射性蜕变.放射性原子，例如铀原子，可以通过质 
点或 Y 射线的发射而变成另一种原子.每种原子表示系统的一个 
可能状态，当过程继续下去吋，我们便得到接连的转移 
E 2 -* ——根据物理理论，只要原子处于状态 E „, 转移 
E „ -* E n + i 的概率就保持不变，而这个假设是用我们的初始假定 
来表示的.所以过程由微分方程 （3.2) 来描述(对于物理学家来说 
这是一个熟知的事实）.如果£„是不能由它作进一步的转移的终 
了状态，则4 = 0且方程组 （3.2) 截止于 n = (对于我 
们自动地得到 P „ O )=-0 .) ' 

0>)尤尔 （ Ylrfe ) 过程. 考虑一个总体， 其成员能(通过分裂 
或其它方式)生出新成员而不致死亡.在长为 A 的任何短的时间 
间隔中，每个成员产生一个新成员的概率为 ; W + o ( A ); 常数； I 确 
定总体的增长速度.如果成员之间无相互作用且在时刻 * 总体的 
大小为《,则在 （6 / + A ) 中总体增大的概率为+ o ( A ) .因 
此总体恰有"个元素的概率 P „(0 满足 （3.2) (其中 I = 即 
KC0 = — + (« — Oxp^CO (» > 1). (3.4) 

如果丨是在 < = 0时总体的大小，则初始条件 （3.3) 成立.容易 
验坻,当"时解由 

P a (0 = f " 1 ) e~ ni (l — e - Ki y -* (3.5) 

\ n 一 if 

给出； 显然，当 》< ; 吋 p „0) = o . 这个分布是负伯努利分布的 
特殊 情况： 利用第六章中的定义 (8.1) 我们可将 （3.5) 改写为 
p «(0 = /(« - /•； c - l 0. 由此可知[参看第九章例 (3x)1, 在时 
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刻*总体的大小是<_个独立随机变量之和，其中每个变量的分布 
可由在(3.5> 中用1代替 i 而得.这 i 个变量表示我们的总体< 
个原始成员的 后裔. 

这神类型的过程首先被尤尔 " 联系到数学进化论而研究.总 
体由一个属中的物种组成，新元素的产生是由于突变.每一物种具 
有产生新种的相同概率的假设忽略了物种大小上的差别.因为我 
们也忽略了物种灭绝的可能性，故可以预料> 公式 （3.5) 仅给出一 
个粗糙的近似.弗里 [54] ( W . H . Furry ) 曾用相同的模型描述与 
宇宙射线有关的过程，但近似也是相当粗糙的.微分方程 （3.0 严 
格地适用于能分裂为它们自身的精确副本的质点的总体 ，当然 ，这 
以质点之间没有相互作用为条件. 


*4. 发散的增殖过程 

无限微分方程组 (3.2) 满足初始条件 （3.3) 的解可从 P ,( r ) = 
A 1 出发归纳地算出.所以分布被唯一地确定.由解线 
性微分方程的熟悉公式也可推出剩下的未解决的问 
题是，是否确实为一概率分布，即是否对所有的*有 

EP „(0 = 1. (4.1) 

我们将看到，情况并不总是 如此： 如果系数 k 增加得充分快，则 
可能有 

- 2 X (0 <1. (4-2) 

乍一看来，这种可能性似乎是奇怪和麻烦的，但它有如下一种简单 
的解释. （4.2) 的左边可以解释为在时刻 f 仅发生有限个变化的 


1) 见 [50], 该书以 [51] 中的结论为基础.尤尔并未引入微分方程 （3.4)， 而是用 
类似于第六章第5节关于普阿松过程所使用的极限过程来推导 P . C 0. 姆’肯德 
里克 （ A . G _ M ’ Kendrick ) 在 [52] 中设计了更一般> 更灵巧的模型，并将它 
们应用于流行病和总体的增长中.遗憾的是，这篇非凡的论文实际上并未受到 
注意.特別是，本书作者在 [53 J 中引人总体增长的各种随机过程模型时也不 
知道 [52] 中的 结果/ 

氺 本节讨论专门的论题，可以略去， 
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概率.所以 (4.2) 两边的差正说明无限多个变化或一种爆炸的可 
能性.为了更好地理解这个现象，让我们将我们的增长概率模型 
与熟知的决定论方法相比较. 

(3.2) 中的量可称为总体大小为《时的平均增长速度.例 
如，在特殊情况 (3.4) 我们有 I = 故平均增长速度与总体的 

实际大小成比例.如果增长不受随机起伏的影响且增加的速度与 
瞬时的总体大小成比例，则满足如下决定论的微分方程 

•Mfl = (4.3) 

dt 

由此可以推出，在时刻*总体的大小为 

x{t) = ie u y^ ( 44 ) 

此处 ： = <0)是初始的总体大小. （3.4) 与 （4.3) 之间的联系并 

不纯粹是形式上的.容易看到： (4.4) 实际上给出分布 (3.5) 的期 
望值，故 （4.3) 描述期望的总体大小，而 （3.4) 则考虑随机起伏. 

现在让 我们考虑一个决定论的增长过程，其中增长速度增加 
得比总体的大小快.当增长速度与 xKO 成比例时,对应的微分方 

(45) 


(4.6) 

注意，当 £ — 1/ A / 时 KO 无限增大.换句话说，增长速度按总体 
大小的平方增加的假设蕴涵在一个有限时_间隔中的无限增长. 
类似地，如果 （3.4) 中的 L 增加得太快，则在一个有限的时间间隔 
中有无穷多个变化发生的概率为正 3 如孑定理给出了使这样一个 
发散的增长出现的精确 条件： 

定理. 使 （4.1) 对所 有的/ 成立的充分必要条件是级数 

(4 . 7) 




其解为 


厂 


1 而）， 




Ut 
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发散. 

证.令 

5^(0 = PoCO +•'••+ p 々 (0 ， (4.8) 

我们由 （3、2) 得 

S'^dO =5. — （ 4.9) 

故当々 >/ 时有 

1 一 心0)=心 p t ( r ) 办. (4.10) 

因为 （4.8) 中的所有项都是非负的，所以序列\0)——对于固定 
的 t ——仅能随着々增加，故（4_10)的右边相对于々来说单调减 
少.用.《0 )表示其极限.于是对于有 

又々 ( 打 > 〆 #)， (4.11) 

Jo 

故 

^ 〆 ，)(士 + + …+ 士 ). (4.12) 

由于 (4.10), 我们有 乂 (0 < 1，故 （4.12) 的左边最多为 /. 如果 
级数 (4.7) 发散，则 (4.12) 右边的第二个因子趋向于无穷，故对于 
所有的 < 仅当 〆 <)= 0吋不等式才能成立.在这种情况，当々 — 
00时 （4.10) 的右边趋向于零，因此 S /0—1， 故 （4.1) 成立.反 
之，积分 (4.8) 并利用 (4.10), 我们看到 （4.12) 的左边小于 V 1 + 
+ • * * + 如果级数 (4.7) 收敛，则这个表达式是有界的， 

因而对于所有的《，5„(0 -♦ 1是不可能的. 


5.生灭过程 


第3节中的纯增殖过程提供了放射性蛻变的一个令人满意的 
描述，但它不能作为其成员会死亡(或退出）的总体的大小的变化 
的现实模型.这启发我们将这个模型作如下推广，不仅允许从状 
态 仏转移 到邻近的较高的状态 E „ +1) 也允许从£„转移到邻近的 
较低的状态(更一般的过程将在第9节中定义 .） 因此我们 
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的出发点是如下的 . 

假设.系统的变化仅通过状态向其邻近状态转移（当 
吋由到 S n +1 或但由馬仅能到瓦）而发生.如果在任' 
何时刻£系统处于状态 E „， 则在 （/， f + / i ) 中出 J ® 转移 — 
E „ + l 的概率等于 U + oih ), 而 4 (如果 1) 的概率 
等于 . 《„A + o ( A ). 在 Gw + A ) 中出现一个以上的变化的概率为 
o(A). 

容易修改第2节中的方法来导出关于系统在时_ £位于状态 
E „ 的概率 P „(0 的微分方程.为计算+ >乂我们注意，在时 
刻 t + h 9 仅当下列条件之一满足时，系统才可能处于状态 
(1) 在吋刻£系统处于 E „ 且在/ + A ) 中无变化 出现； （ 2 )在 
时刻 * 系统处于 E a _, 且在 （G / + A ) 中出现到£»的一个转移； 
(3) 在吋刻《系统处于 E „ +1 且在心， t + A ) 中出现到的一个 
转移； （4) 在 （/W + A ) 中出现两个或更多的转移.根据假设，最 
后的事件的概率为 o ( A ). 前三个事件是互不相容的，故它们的槪 
率 相加. 所以 

PnO + A) — P«0){1 — — 

+ + Hn + l ^ Pn - t - lO ') + • (5. l ) 

将项 PXO 移到左边并以 a 除等式两边，在左边我们得到 匕 (0 的 
差商.令 a 4 0,我们得 

K(.t ) = 一 ( 义 „ + /t*)P B CO 4- X n - l P„- x O') + ft n +iP n +i(.t\ (5.2) 
这个方程对于1 _立.对于《 = 0,用同样的方法可得 

PiCO = — XoPoCO + fiiPXO . (5.3) 

如果在时刻零系统处于状态巧，则初始条件为 

P ,(0) = 1， P „(0) = 0 (« ^ 0. (5.4) 

于是我们看出，生灭过程依赖于无穷微分方程组 (5.2) — (5.3) 
及初始条件 (5.4). 在这种情况，解的存在与唯一性问题决不是平 
凡的.在纯增殖过程中，微分方程组 （3.2) 也是无穷的，但它有递 
推关系的 形式； PoiO 由第一个方程所决定，而 P „0) 能由 tiG ) 
来计算.新方程组 (5.2) 并不具有这种形式，因而所有的 PM ) 必 
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须同吋求出.我们将在这里(以及本章其它地方)陈述解的性质而 
不给出其证明 n . 

对于任意指定的系数4 > 0, N > 0,总存在 （5.2)—(5.4) 的 
一组正解 { P n O )}, 使得 2^(0 < 1. 如果系数有界(或增加得充 
分慢)，则这个解是唯一的且满足正则性条件= 1. 不过， 
适当选择系数使得< 1且存在无穷多个解也是可能的， 
在后一种情况，我们遇到在前一节中类似于纯增殖过程所研究过 
的现象.这种情况具有重要的理论 意义' 但读者可以放心，在所 
有具有实际意义的情况，唯一性条件是满 足的; 在这种情况自动有 
= 1 (见第 10节). 

当為= 0吋，转移£。 -> &是不可能的.用马尔科夫链的术 
语来说，是一吸收伏态，从它退出是不可 能的； 一但系统处于 
Eo , 它就停留在那里.由 （5.3) 可以推出，在这种情况有朽 0) > 0, 
故 iV )) 单调增加.极限 &(<») 是最终吸收的概率. 

更一般，可以证明，极限 

lim P „ 0 ) = pn (5.5) 

% -*oo 

存在且不依赖于初始条件 (5.4); 它们满足在 （5.2) — (5.3) 中令 
KO ) = 0而得到的线性方程组.关系 （5.5) 通常解释为一种“朝 
向稳荦状态条件的趋势”，而这个富于暗示的名称已引起了很多混 
乱.必须了解，除当£。是吸收状态外，随机起伏仍然永远不会减 
少，（ 5 . 5 )仅表明，初姶条件的影响最终将会消失.第十五章第6 
节关于统计平衡的附注在这里完全适用. 

(5.5) 的正确性可由关于 P b G ) 的明显公式或由一般的遍历性 
定理来证明.通过将我们的过程与具有转移概率 


0适用于本章大多数一般方程的一个简单的存在证明和唯一性准则（虽然用到了 
拉氏变换)在 [55] 的第4节中被得到.笫一个存在证明见 [36]. 遗憾的是，这 
篇论文处理非可数样本空间和系数依赖于时间的一般情况，且将其结果特殊化 
为本章所讨论的常系数常微分方程的情况就导致一个简单的存在证明这一事 
实，一般未受到注意. 

2) 生灭过程的使得 ZP.CO < 1的解最近受到普遍的注意.见 [57] 与 [58]. 
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Pn.«+l = -~ f —， Pn , n-l = — (5.6) 

A n ■ r - ft n 

的简单乌尔科夫链相比较，在直观上我们的定理变得几乎是显然 
的.在这个链中，仅有的直接转移为 E „ — £„ +1 与艮 — E # ，它 
们与我们的过程具有相同的条件 概率； 这个链与我们的过程之间 
的差别在于，对于后者，变化能在任意时刻出现，故在时间 * 内的 
转移数是一随机变量.不过，对于大的~这个数必然很大，因此 
当《 — QO 时？„( { )的状态与简单链的对应条件概率相同表面上是 
讲得通的. 

生灭过程主要在排队、占线等问题中有着应用•，见第6 ,与第 
7 节. ' 

例 .（0 线性 增长. 设总体由能分裂或死亡的元素组成.在 
任何长为 A 的短的吋间间隔内一个活着的元素分裂为二的概率为 
M + o { h ), 而对应的死亡概率为+ oCA ). 此处; I 与 P 是总体 
的两个常数特征.如果元素间无相互作用，则我们 得到夂 =»又, 
如=«^的生灭过程.基本微分方程具有如下 形式： 

Po (0 = #(0， . 

= — (i + ft ) nP „(0 + _ l ) P n - l (0 

+ 〆 》 + 1) P „ +1 (#). (5.7) 

显解可以求出 n (参看问题 9-11), 但此处不打算讨论邊方面 
的问题.极限（ 5 . 5 )存在且满足具有纪(0 = 0的方程 （5.7) .由 
第一个方程我们得到 A = 0,又由归纳法从第二个方程可以看出， 
对于所有的《 > 1 有/>» = 0 . 如果外 =1 ，则我们可以说，最终 
绝灭的概率为 1. 如果 Po < 则关系= />J = * * * = 0蕴涵总 
体以槪率1 — A 增大超过任何界限;最后总体必定逐渐消灭或无 
限增加.为了求得绝灭概率外，我们将过程与有关马尔科夫链相 
比较.在我们的情况，转移槪率 (5.6) 不依赖于《，所以我们有一 


1) 通常的解法是，导出关于母函数 s P . CO ^" 的偏微分 方程. 在[5 9 ]中详细讨 
论了允许 0 . 7 ) 中的系数依赖于时间的一个更一般的过程.也见同一作者的 
[60] ，-在那里将理论作了推广，以考虑生物总体的年龄分布. 
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个 M 常的随机徘徊，其中向右移动一步与向左移动一步的概率分 
别为 P + fi) 与 q = nKl + jtt ). 状态 E 。 （或 ■*：=()) 

是一个吸收壁.由古典输光问题可知(见第十四章第2节），如果 
则绝灭概率为1;如果 q < p , 则这个概率为^ iq / py , 其中 
f 为初始状态.我们得到如下 结论： 在我们的过程中，最终绝灭 
的概率，当 A < "时为1，当 ;I > P 时为 (.« A ) r . (这容易由显解 
来验证;见问题 10.) 

像在很多类似的情况中那样， （5.7) 的显解是相当复杂的，因 
此我们希望直接从微分方程来计算分布 { P „ W } 的均值与方差. 
对于均值我们有 


M 0) = 2 (5.8) 

»- 1 

我们将略去 MC0 为有限以及下面的形式运算为合理（这两者均 
容易由问题10中所给的解推出）的正式证明. 以”乘 (5.7) 中的 
第二个方程，并对《 = 1，2, •…，求和，我们发现含有的项可 
以消去，于是我们得 

M\i) = — 1 )?„-,(/) — ,«S(« + l)P„+iCO 

= (A-/0MC0. (5.9) 

这是关于 MO ) 的一个微分方程.在时刻£ = 0总体大小为^故 
M (0) = »'. 所以 

M (/) = te n ~ ,l), . (5.10) 

我们看到，均值趋向于0 或无穷，按照或 ).> ft - 而定. 
{ P „(0 的方差能用类似的方法来计算(参看问题 12). 

( b ) 单线路的排队问题. 在常系数》„ == 〜 的最简单 

情況 5 生灭过程化归为例 （7. b ) 中的排队问题当“=1的特殊情 
况 • 、 一 


6. 指数持续时间 

生灭过程的主要应用领域与电话工程中的占线以及电话、计 
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数器或机器中的各种排队问题有关.这种类型的问题能够用近似 
程度不同的各种数学模型来处理.生灭过程的方法提供一种最容 
易的门径，但这个模型以指数持续吋间假设这一数学简化为基础. 
我们首先讨论这个基本假设. 

为语言具体起见,让我们首先考虑电话会话，我们假定，会话 
的长度必须为秒的整倍数.我们把会话的长度作为一个随机变量 
来处理，并假定其概率分布九== P{X = «} 为已知.于是电话线 
路表示一个物理系统，它的两个状态是“忙碌 ”( E a ) 和“空闲” (艮） . 
如果在一个任意的时刻《线路是忙碌的，则在下一秒中状态发生 
变化的概率与会话已进行多久有关.换句话说，过去对将来有影 
响，因此我们的过程不是马尔科夫过程(见第十五章第10 节).在 
更复杂的问题中，这种情况是大多数困难的根源..不过，存在一种 
我们曾在第十三章第9节中详细讨论过的简单的例外情况. 

设想在每一秒钟会话是否继续下去，由一个不对称的钱币来 
随机地决定.换句话说，一列成功概率为 P 的伯努利试验以毎秒一 
次的速度进行，直到出现第一次成功为止.当这个第一次成功出 
现时会话结束.在这种情况，会话的总长，即“持续时间”，具有几 
何分布 fn = a 如果在任何吋刻 r 线路是忙碌的，则它在下 
一秒仍然忙碌的概率为1而出现转移 Eo — E , 的槪率则为在 
现在的情況这些概率与线路忙碌有多久无关. 

如不将时间参数离散化，则我们必须处理连续型随机变量.这 
时等待时间的几何分布的作用由指数分布来接替.这是具有马尔 
科夫性亦即完全缺乏记忆的仅有分布.换句话说，在吋刻*进行 
的会话继续进行到 * + A 以后的概率与会话已持续的时间无关， 
其充要条件是，会话持续£个时间单位以上的概率由指数函数 
厂" 给出.这个“指数持续时间分布”就是普阿松分布 （1.1) 中的 
零项，亦即直到第一次变化出现的等待时间超过£的概率. 

生灭过程的方法仅当问题中的转移概率不依赖于过去时才能 
应用； 对于占线和排队问题，这意味着所有持续时间必须是指数 
的.从实际观点来看，这个假设乍一看来可能显得有点不自然，但 
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经验表明，它合理地描述了实际现秦.特别，很多测量都征明，在 
—个城市中的电话会话 1 >惊人精确地服从指数律.对于其它的持 
续吋间(例如，机器修理的持续时间 ■)， 情况也是如此. 

尚须刻划所谓来到的流(来到的呼唤、机器的故障等).我们 
假定，在任何长为 A 的时间间隔中来到一个呼唤的概率为; IA 与一 
个可忽略项之和，且多于一个呼唤的槪率在取极限时可以略去. 
根据第2节的结果，这意味着来到的呼唤具有均值为 U 的普阿松 
分布.在这种情况我们说来到的流是强度为; I 的普阿松型流. 

容易验证指数持续时间的所述性质.用《(0表示会话至少持续£个时 
间单位的概率.从时刻0开始的会话持续到/ + f 以后的概率0等 
于它持续/单位以上的概率乘已知会话长超过/的条件下，会话再持续 J 单 
位以上的条件概率.如果过去的持续时间无影响，则上述条件概率必须为 
<0;即我们必须有 

u(e + s) = ). (6.1) 

尚须证明的是 

定 a. 设》(0对于 * > 0 有 定义，且在每个有限区间中 有界 . 如果 
«(<) 满足 （6.1), 则或者对于所有的 * 有 <*) = 0,或者存在某个常数 A , 
使得 《(0 = f . 

证.如果 "(*) 不恒为零，则存在一个点6使得 K 约 > 0. 令 A => 
— lo *«( ar ) 及 1<0 = e “ a («). 则 

十 = v ( t ) v ( s '), r ( l ) = 1 (6.2) 

且我们将证明对于所有的《 > 0有 t <0 = 1. 显然 ^(1/2) = »<1) = 1, 
—般对于每个整数 n > 0有 k »( I /») = v ( l ) = 1 . 所以 »( l / o ) = 1,由此 
对于每对整数 w > 0, n > 0有 1 '(巧>) = v m ( l / n ) = 1. 故 对于每个有理 
数，有= 1 . 现在设 v { r ) = f 与 I .于是 ) = r - i , 故我们可以假 
定 oi . 在这神情况，通过选取 iv 充分大，就可使 似 ㈣ =，任 
意大.现在我们在区间 

Nr — I < r < Nt 

中选取 — 个有理数.于是 

v(Nt — r) — v^Nt — r)v( r ) = tf(^Nx) = c N ， ( 6 . 3 ) 

1) 对于城市间的会话，公司通常按三分钟的间隔收费.因此持续时间多半是三分 
钟的倍数.这与指数律有系统的偏差，于是我们的理论不能应用. 
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这表明在区间0 < a <1中存在一个点 a == Nr — 使得 v { a )> e H ,这与 
< r ) 因而〃 (/) 在每个有限区间中有界的假设茅盾. 

7. 排队与服务问题 

G ) 最简单的占线问題 1 >. 设有无穷多条线路可以采用，且会 
话在间隔+ A ) 结束的概率为 〆 与当 k — 0 吋可以略去 
的项之和(指数持续时间).来到的呼唤构成强度为 A 的普 阿松型 
流.如果有《条线路是忙碌的，则系统处于状态 

当然我们假定，会话的持续时间相互独立.如果有《条线路 
是忙碌的，则在长为 A 的时间内它们之中将有一个空闲的概率为 
nfih + • 在这段时间内有两个或多个会话结束的捆率显然与 

y 有相同的阶，因而可以略去.来到一个新呼唤的概率为 M + 
o ( Ji ). 几个呼唤的一个混合，或一个来到的_唤与一个结束的会 
话的概率也是 O ( A ).. 于是由第5节中的记号，有 

K = A , ix „ = » 〆 • （7.1) 

基本微分方程(5.2)-(5.3)具有如下形式0 > 1) 

Po (0 — ~~ 又 PoW + (7-2) 

KCO = — (又 + nfOPnit ) + + (n 4- l )^ tP ,, + ,0). 

显解可以通过导出关于母函数的一个偏微分方程而得到（参 
看问题 13). 我们只要确定 (5.5) 中的量九 == lim PM . 它们满 
足方程 

Vo'= 咏， 

(又 + n;x)p n = lp n - x 十 Oj + l);tp n+1 . (7.3) 

用归纳法我们求得 /Vi = A ( VaO ” A !， 因此 


1) 见 [61]. 关于电话交换台的排队和占线问题，早在随机过程的理论可以利用并 
对理论的发展产生激励的影响之前，就已被研究.尤其是，已经表明，巴尔姆的 
给人深刻印象的工作，在其后很多年对好几个作者都有过帮助.在这个领域中 
最早的工作者是埃尔兰 （ A . K. Erlang) (1878—1929) .见 「 62] • 具有独立 
价值的开拓性工作已由弗里完成，见 [63]; 这本书为概率论的工程应用的发展 
做了许多工作. 
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Pa ^ e -v,QdM}l t ( 7 . 4 ) 

n\ 

于是，极限分布为具有参数 W 的普阿松分布.它与初姶状态无 

关. 

齊易求出均值 M (/) = i ： nP K ( t ). 以》乘（ 7 . 2 )中的 第”个 方程并栢加， 
: 考虑到人 (*) 之和为1,我们得到 

M’(/) » A — (7,5) 

如果初始状态为巧，则《(0)。、且 

Ai(/) = A (1 — + { 7 . 6 ) 

当 < — 00 时，我们看到， «(/) 趋向于上面昕求得的普阿松分布的昀值.读者 
可以验证， 在* = 0的特殊倩况， P .(0 精确地由均值为«(0的普阿松分布 
给出 . 、 

( b ) 有限条线路的 推队问 睡 1 “ 1 .现在我们修改上面的例子， 
以得出一个更现实的模型.除线路数目有限外，假设与上例相同. 
如果所有的线路都是忙碌的，则每个新来的呼唤参加排队并一直 
等到有一条线路空闲为止.这意味着所有的线路有一个公共的排 
队列. ' 

“线路”一词可用邮局中的柜台来代替，而会话则用服务来代 
替.实际上我们所讨论的是仅当所有《条线路都忙碌时才需等待 
的一般排队问题. 

如果恰有〃个人在接受服务或在排队，则我们说系统处于状 
态仅当® > «时才出现排队，此吋参加排队的共有《 — 

人. 

只要仅有一条线路空闲，情况就和前面的例子完全一样.不 
过，如果系统处于状态，其中》>〜则 仅有“ 个会话在进行，因 
而当》> «时我们有内=叩.因此基本微分方程组当》< a 时 
甶（7;2)给出，而当》> </时则由 

KC0 =* 一 0十 afOPXt) + IPi-M + (7.7) 

给出. 

在单一线路的特殊情况 0 = 1), 这些方程化归为系 数与” 
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无关的生灭过程的方程. 

(5.5) 的极哏6存在，它们当吋满甩(7.3)，而当》 


时则满足 

(又 ■+ 

• = 冰- 1 

+ ‘略 +u 

(7.8) 

由递推法可得 

Pn ; 

(1/ uY 

«! 

n 《 a 9 

(7.9) 


Pn - 

77 ^ p0i 

a 9 

(7.10) 

仅当 


— ct 


(7-11) 


时级数收敛.因此，如果 （7. U ) 不成立，则极限分布 
{ p A } 不可能存在.在这种情況对于所有的 ”有九 = 0,这意味 
着，排队的度逐渐地无限增大.另一方面，如果（7.11>成立，则 
我们能确定 ft 使得 (7.9) 式与 (7.11) 式之和为 1. 虽然我们尚未 
导出的显式，但由它可以证明，这样得 到的九 确实表示^(0 
的极限分布.表1给出了 . = 3, * 2的一个数值例题. 


占线数. 
等待人数 


表1 

当 线络数= 3且 AAl = 2 时的极 限槪率 


0 

0 

0 


0.1111 


1 2 3 4 5 6 1 

1 2 3 3 3 3 3 

0 0 0 ! 2 J 4 

0.2222 0.2222 0.1481 0.0988 0.0658 0.0459 0.0293 


(C) 机器维修问級 A 本例与下例中所导出的结果已在瑞典 


工业中获得成功的应用.为明确起见，我们首.先讨论最简单的情 
况，然后在下一个例子中进行推广.问题如下. 

我们考虑在正常情况下不需人看管的自动机器.但机器在任 


1) 例 （o 与 （d)， 包括数值例题，都取自 [65]. 最经济的修理工的.数目的图衷是 
由帕姆给出的， 
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何时刻都可能发生故障因而需要维修.机器所需的维修时间可以 
看作是一个具有指数分布的随机变量.换句话说，机器可用具有 
如下性质的两个常数 A 与<«来刻划.如果在时刻*机器处于运转 
状态，则它在时刻 I + A 之前需要维修的概率为 AA 与当 A — 0吋 
可以忽略的项之和.反之，如果在时刻 * 机器正在维修，则维修时 
间在£ +• A 之前结束因而机器恢复运转伏态的概率为+ o ( h ). 
对于高效率的机器; t 应相对地小而^则应相对地大.比值 V # 称 
为维修因子. 

我们假定，具有相同参数 A 与户且独立运转的台机器由一 
个修理工负责维修.当机器发生故障时立即进行维修，除非修理 
工正在维修另一台机器，在后一种情况就形成排队.如果不运转 
的机器有《台，则我们说系统处于状态玉1 < « 意味着有 

一台机器在维修 ，〃一 1台在排队(待 修）； 当系统处于状态 E a 时， 
所有机器都运转而修理工则闲着. 

转移 — E „ +1 是由于 w —》台运转机器中有一台出了故 
障而引起的，而转移则是由于有一台被维修的机器恢 
复运转伏态而出现的.因此我们得到一个生灭过程，其系数为 
又 , (w _ n ) l , j£to = 0, fii = = fty (7.12) 

而基本微分方程 （5.2) 与 (5.3) 则变为 （1 — 1): 

Po(#l =* - mXPXt ) + ftPi (0 3 . 

KCO = — {{m — n)X + "} P „0) 

+ (/« — «+ l ) AP a _!(/) + flPn + Xt^j (7.13) 
= — ftPmO) ■+• UO. 

这是一个有限的微分方程组 } 它可用通常的方法来解.极限 
(5.5) 存在且满足方程 

mlpo = ' up 、， 

{(m — n)X + fi } p n = (m — n + + fip a +ii (7.14) 

== kptn—i.' 

容易证明，如下的递推公式 

(w — n ') lp n == (7.15) 
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成立.依次以 — 2，•••，1 3 0代入3我们得 

Pm ~ k = ( f )* * Pm ' (716> 

未知常数 A 能 由诸朽 之和为1的条件 得到： ^ 

/- w =={l+i(f) I +-*-+-^(f) n， } (7-160 

公式 (7.16) 是为线路工程师所熟知的埃尔兰损失公式.在表2中 
列出了典型数值. 


表2 

当<» = 6_时的概率 
(埃尔兰损失公式） 


n 

0 

1 

2 



等待维修的机器数 Pn 

0 0.4845 

0 0.29U7 

1 0.1454 

2 0.0.582 

3 0.0175 

4 0.0035 

5 0.U003 


概率 A 可以解释为修理工闲着的概率（在表2的例子中他应 
当约有一半的时间是闲着的).等待维修的机器的期望数为 


^ S ^ — ^ S ^ — (1 Po ) 9 (7-17) 

* = 1 女=1 • 

这个量可以通过将关系式（7.15)对》= 0, 1， •…， 《求和来计 
算.利用诸九之和为1这一事实，我们得到 

ntX 一 Xw 一 凡 (1 一 p Q ) 城 ^(1 — p 9 ) 

或- 


一-宁 ( H ). (7 .⑻ 

在表2的例中我们有 ^-6 - (0.0549), 于是0,0549是一台机器 


^ 151 • 



对于排队列的平均贡献. 

( d ) 续上： 多个修理工的情况.我们将不改变上个问题中的 
基本假设，只是 m 台机器现在是由”个修理工0 < /») 来维修. 
于是当《 < r 时状态£„意味着 r 一《个修理工闲着 ，” 台机器 
在维修，而没有机器等待维修.当时状态£„意指， r 台机 
器在维修而 r 台机器则在待修.除了 （7.12) 显然应由 
^0 = ml , = 0, 

1„ = {m — n)A, ft n = nfi (1 ^ ^ r), (7.19) 

X n = (m — n)X, — rf.i (r ^ ^ fn) 

来代替外，上例中的方法仍然适用，我们将不写出基本微分方程 
组，而仅写出极限槪率八的方程.它们是 

mlpo = ftpi, 

{(”i 一 «)X ■+■ «/<} p„ »= («» 一 n + 1) 又浐 a _j 

+ (« + ')ftpn+' (1 ^ « < r), (7.20) 

{O — n)l + r^}p„ ==(»!—« + 

+ rftp a+l (r < n < /w). 

从第一个方程我们得到比值, A / ft . 由第二个方程用归纳法对于 
b < r 可得 

(« + 1) P / Vh = («» — ； (7.21) 

最后，对于 《> r ， 由 （7.20) 中的最后一个方程可得 

r ^ Pn+i *=(»» — / I )又 p „. (7-22) 

由这些方程可以依次算出比值 pjp 。. 最后， ft 可由条件1 
推出.表3中的值就是用这种方法得到的. 

我们比较表2与表3就可看出一些惊人的事实.我们注 
意，这两个表所参照的是相同的机器 a/ M = 0.1)，但在第二种情 
况，我们有« = 20台机器及 r = 3个修理工.每个修理工所照 
管的机器数已由6增加到衫，而与此同吋，机器更有效地得到维 
修，让我们用 
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机器数 


(7.23) 



表 3 


当 A/p = CKl 3 ot — 20, r = 3 时的槪率 6 
n 被维修的机器数 待维修的机器数 闲1的修理 -C 数 Pn 


0 

1 

2 

3 

5 

€ 

7 

8 
9 

10 

11 

12 


0 

1 

2 

3 

3 

3 

3 

3 

3 

3 

3 

3 

3 


0 

0 

0 

0 


3 

2 

1 

0 


1 

2 

3 


0 

0 

0 




0 


5 0 

6 0 


0 


8 0 

9 0 


0.13625 

0.27250 

0.25888 

0.15533 

0.08802 

0.04694 

0.02347 

0.01095 

0.00475 

0.00190 

0.00070 

0.00023 

0.00007 


来定义机器的损失系数，用 

p ^ 闲着的修理工的平均数 
»• 修理工数 


(7.24) 


来定义修理工的损失系数.为了实用的目的，我们可以把槪率 
P »0) 及其极限等同 起来. 在表3中我们有 W ==内+ 2外+ 
3/> 6 + ••- + 17 p K 及 p = 3办+ 2朽+ ft . 表4明确地证明，对于 
我们的特定机器(对于它们 V ^= o . i ) 来说，每二十台机器三个修 
理工要比每六台机器一个修理工更经济一些.第449页脚注提到 
的帕姆的表使我们能够求出每台机器的修理工的最经济的比率. 


表4 

伊 f 00与 （ d ) 中所讨论的两种维修制的效率的比较 



I 

U 

机器数 

6 

20 

修理工数 

1 

3 

每个修理工的机器数 

6 

6% 

修理工的损失系数 

0.4845 

0.侧2 

机器的损失系数 

0.0549 

0.01694 
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( e ) 能量供 应问發设一条电路供应间歇地用电的“个焊 
工.如果一个焊工在时刻，用电，则他在吋刻/ + A 停止用电的 
概率为 M + o ( A ); 如果在时刻 < 他不用电，则他在时刻 * + A 以 
前需用电的概率为 W + o ( A ). 各个焊工彼此独立地工作. 

如果《个焊工在用电，则我们说系统处于状态 E a . 于是我们 
仅有有限个状态•••， E 3 . 

如果系统处于状态 E b ， 则《 _«个焊工不用电，且在时间 A 
内增加一个新的用电者的概率为 （fl — «) M 十 oOO ; 另一方面， 
«个焊工之一停止用电的概率为因此我们得到一个 
生灭过程，其中 

又 „ = (a — »)1, fi t = «,«, 0 < » ^ (7.25) 

基本微分方程成为 (1 1) ' 


f'cO) =*= — axp 0 (t) + fiP,0)> 

K0) = — {«/« + (a — n)Z}P„(t) + (n + l)/tP a+l 0) /fr 

/ 、 - C7.26) 

+ (a — 小 + i ) jlp „^(0 9 

P :(/) = — a t uP a 0) 

容易验证，极限概率由二项分布 


Pn 


:)( 击 )°( 由 ) 


给出，这个结果是可以根据直观的理由而预料到的. 


(7.27) 


8. 向后(瞻后)方程 

在&上各节中我们研究了在时刻 * 系统处于状态 E „ 的概率 
PnU \ 这个记号是方便的，但由于它没有提到系统在时刻零的初 
始状态，故易引起混淆.所以为了理论上的目的引人记号 
是更自然的；这是已知系统在时刻零处于状¥艮的条件下，它在 
时刻*处于状态的概率. &•„(>) 称为转移概率. 

必细强调，我们一直在研究这些转移概率，且除记号外，没有 

1>这个例子是根据〖66]中所研究的问题(论述不够完善)而提 出的， 
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任何改变.如果已知初姶状态为 E ,.， 则 { PM } 是在时刻 * 的绝 
对概率分布.如果在时刻零我们仅有初始状态的= ■个概 率分布 
{ qA , 则在时刻/， A 的概率为 


Qnit) - 2 qiPM. (8-li 


在纯增殖过程与生灭过程的情況，我们曾看到，对于任意固定 
的 *‘ 转移概率 PM 满足基本微分方程 （3.2) 与 (5.2). 下标/仅 
• 在初始条件中出现，后者现在应当写为 


PM = 


( 8 . 2 ) 


对于 n ― iy 
_0，其它情况. 

这些基本微分方程是用将时间区间 （0, 0延长到 （0, * + A ) 
并考虑在一段短时间中的改变的方法而导出的.我们也能将区间 


(0, 0沿过去的方向延长并考虑（一心 0) 中的改变.用这种方法 
我们得到一组新的微分方程，其中《 (代替 》_) 保持固定. 

首先考虑纯增殖过程的情况，并且我们略去其概率以比 A 更 
快的速度趋向于0的_件.如果系统在时刻一处于 £,(*• > 0) 
而在时刻 * 转移到则在时刻0它以概率1 一 0( h ) 处于 E , •或 
E i + l . 根据第2节与第3节中的方法，我们有 

P in (t + A) = 朽 „(0(1 - U) + P i+l , n {t)X,h + oW. (8.3) 


因此对于 /> 0 新的基本微分方程组具有如下形式 


P ' iXt ) =® — hPinO ') - t * hPi + UnO )， (8.4) 

及 

KXO = —九 oPo »(，). (8.5) 

这些方程称为向后方程 5 为区别起见，我们称方程 （3.2) 为向前方 
程.初始条件匁 (8.2). 

在生灭过程的情況，如果在时刻一 A 系统处于状态 E ; ， 则在 
时刻零它应当处于 E f+1} E , •或于是用同样的方法就可导出 
向后方程 , 


— _ ( 又 ， • + fidPi.nO') -j- (8.6) 

这些方程对应于 （5.2). 
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显然，向前与向后方程不是相互独立的.除在解不唯一的罕 
见情况外，向后方程的带有初始条件 (8.2) 的解自动满足向前方 


程.这些联系此处仅作为下节中一般理论的准备而提及. 

例.普阿松过程. 在第2节中我们已将普阿松表达式 （1.1) 


解释为在任意长为/的时间间隔中恰好来到》个呼唤的概率.如 
果在从0到 z 的时间间隔中恰好来到”个呼唤，则我们说在吋刻 


t 系统处于伏态由在时刻々的 E ; 转移到在时刻6的 E „ 意 
味_在 6) 中来到》— /个呼唤.这仅当》> ;时才有可能， 
因此对于普阿松过程的转移概率我们有 

(”一*)! 

P . B (0) = 0, 当” C /. (8.7) 

向前与向后方程分別为 

P'M - - ^PM + IPi.n-M ( 8 . 8 ) 


及 . „ 

PUO = - i.PM + ^ P i + uXO , (8.9) 

容易验证， C 8.7) 是这两个方程组的解，且满足初姶条件 （8.2). 


9. 推广; 柯尔莫果洛夫方程 

到目前为止，我们仅讨论了从 状态卫 „仅能直接转移到其邻近 
状态 E „ +1 与的过程.而且，过程在时间上是均匀的，即转移 
概率对于所有长为 * 的时间间隔是相同的.现在我们考虑筻一般 
的过程，其中这两个假设都被放弃. 

象在通常马尔科夫链理论中那样，我们将允许从任意状态 E , 
直接转移到任意状态 E b . 转移概率可以随时间变化.这时仅指 
定时间间隔的长度是不够的，而必须指定它的两个端点.因此，我 
们用 & n ( r ， 0来表示已知系统在时刻 ir 的状态为 E ; 的条件下，它 
在其后的时刻*处于状态的条件概率. 仅当 r < f 时记号 
PUr , 0 才有意义.如果过程在时间上是齐次的，则 P, a (A /) 仅 
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依赖于差 * _ r , 于是我们可用 PM (它不依赖于 O 来代替 
Pin(.r, r 十 0. 

我 们的过程的主要性质是第十五章第10节中所讨论过的马 
尔科 夫性： 在任意一个时刻系统的状态已给定的情况下，系统将 
来的变化与过去无关.更精确地说，考虑三个时刻 r < f < /,并 
假定在时刻 r 系统处于状态艮且在时刻 f 处于伏态匕.对于一 
个任意的过程来说，系统在吋刻£处于状态 E „ 的(条件)概率依赖 
于与 v ; 换句话说，不仅“现在的伏态 u 艮对在时刻 * 的状态有影 
响，而且过去的状态对它也有影响.然而，对于马尔科夫过程来说 
情况就不是这样.对于这种过程，所考虑的概率等于0,即 
从时刻 J 的£»转移到吋刻 < 的 E b 的概率.在时刻 r < ] 系统处 
* 于 状态艮 的知识对将来不产生影响.由这个假设可以直接导出 
重要的结论.由时刻 r 的 £,• 转移到时刻 * 的 E „ 必须经过时刻 f 
的某个状态，对于马尔科夫过程来说，经过一个特定状态的槪 
率为^ ( r ，0. 由此我们必须有 

0 *= 2 s) p vn o, o (9.1) 

V 

对〜切 T<sc t 成立.这是查普曼-柯尔莫果洛夫方程.这个方 
程与第十五章的方程 （10.3) 相当； 前者是连续时间参数的情况， 
后者仅当时间参数取整数值时成立. 

在第十五章第10节中我们曾证明，查普曼-柯尔莫果洛夫方 
程并不对所有的随机过程成立.为了我们的目的，我们可用 （9.1) 
来规定我们所涉及的过 程类' 事实上，我们将仅增‘加正规限制并 
由 (9.1) 导出我们的基本微分方程.查普曼-柯尔莫果洛夫方程 
的导出有 g 槪率背景，但我们不需参 考它； 一旦给出了（9.1)，我 
们就能容易地确定槪率 PM 的微分方程并用纯分析的方法进行 
讨论. ' 


1) 柯尔莫果洛夫方程是否刻划了乌尔科夫过程的问题，提出了需要研究现实样本 
函数 x(o 的困难问题.应当记住，我们是在用一种简捷的方法来得出关于某 
S 概率的微分方程，而并未从各个方面对过程进行分沂. 



在时间均匀的过程的情况，方程 or ) 具有如下较简单的形式 
PinO +，）= S P.VO) PM. (9-2) 

V 

对于普阿松过程这个方程化归为普阿松分布的褶积性质〖第十一 
章例 （2. C )]. 

现在我们引入我们的基本正规条件，它显然是生灭过程的初 
姶假设的推广. 

假设 1. 对于每个扶态 E „ 有一个连续函数 cXO > 0与之 

对应; 使得当 A — 0时有 

}~P«nQ,J + hl^ cXtX ( 9 . 3 ) 

A 


(9.3) 的概率解释是显 然的; 如果在 时刻/ 系统处于状态 E»， 
则在0, < + A) 中出现一个改-变的概率为 c n ii)h + o(fi\ 分析 
上，关系 (9.3) 要求，当 i •^时 P„ 力， ，） — 1以及 P-»0, *) 在 
x = t 有导数, 函数起着生灭过程中 + 〜 的作用.在时 
间均匀的过程的情况， G 不依赖于々 

假设 I 对于每对伏态 E y ， E,(j ¥= 0 有转移概率(依 
赖于时间)与之对应，使得当 A — 0时有 

c^p^CO C/ ^0. (9.4) 

h 


/»,*(*) 对于 * 连续，且对于每个固定的 G f 

S = Is fait) = 0, (9.5) 

k 

这里朽 t 0) 可解释为在0, / + A ) 中一个改变自 E , 出现的 
条件下，这个改变使系统由 E / 转移到 E * 的条件 概率. 在生灭过 


程中 




(9-6) 


对于/与々的所有其它组合= 0. 对于每个固定的/， Pm (0 
可以解释为马尔科夫链的转移概率 • 
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这两个假设足够导出 P ik ( r , 0的向后方程组，但对宁向前方 
程我们需要补充 

假设 3. 对于固定的々， (9.4) 中的极限关于一致地成立. 
这个假设的必要性对于无穷微分方程姐的理论有重要意义, 
我们将在下一节讨论. 


下面我们来推导^ Or ，*) (作为*与 r 的函数）的微分方程. 
由方程 （9.1) 我们有 

P ^( r , r + A ) = X ； P 办， 0心0, t + (9.7) 

i 

根据 < 9 . 3 ) 来表示右边的 项匕 … ， z + A >, 我们得 

o = _ 

h 

+ + 2] P . vO , /) P M (/ “十 /O + ..., (9.8) 

其中略去的项随々趋向于 o ，和是对除々外的所有 （来 求的. 
现在我们能将 (9.4) 应用于和中的项.因为（由假设 3) 趋向于极 
限对所有的丨是一致的;故右边有一极限.拼以左边也有极限，这 
意味着 Puit , 0具有对于£的偏导数，且 

— 明一 ^0)P^(r, 0 + 2 P '>( T » 

(9.9) 

这是基本的向前微分方 程组. 注意 ， i 与 r 是固定的，故我们有 
(尽管形式上出现偏导数)关于无限多个函数 /) (々= 0, 1， 
2, •••） 的常微分方程组.参数 *_ 与^仅在初始条件中出现 - 


P^(r, t) 


fl , 当卜*•， 
to > 其它情况. 


(9.10) 


向后微分方程组可用类似的方法得到，而且推导实际上更为 
简单，因为我们完全不需要假设 3 .至于方程（ 9 .3)与（义 4 )，采 
用形式 


1 一 PnaO — h, t) 
h 


cXi) 


(9.3 a ) 
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Pjt.QsZ h.0 — O'=5^0. (9.4a) 

h 

能够证明这些关系与 (9.3) 及 (9.4) 等价，但我们将简单地以 (9.3 a )， 
(9.4 a ) 与 （9.5) 作为我们的基本假设而着手讨论.将査普曼-柯尔 
莫果洛夫方程改写为如下形式 « ' 

Pikit — a, 0 = 2 p i 人 t 一 &， ( 9 VO 

V 

利用 （9.3 a ) (其中 》= i )， 我们得到 

— f /( r ) P ,_々( r ，，） 

h 

+ — — A ， r 〉 P p 々 (r，0 + (m) 

h v ^i h 

这里 A - 1 尸 , v (r — A 5 r ) c ^ t ) / v v ( r ), 且 (9,12) 右边的和中的极 
限总是一致收敛的，事实上，如果则我们有 

09 

0< A - 1 S ^{ t - h 3 t ) p vK { t s o 

t» 1 


c (一 A ， r> < H 1 - - 

—*• Ciit ') |l — 2 (9.13) 


由条件 (9-5), 选取充分大的 iV 就可使上式右边任意小.由此可 
知，在 (9.12) 中逐项取极限是容许的，于是我们得到 

9 P ^ >Jl ^ i ) - Ci ( r ) S 真(言)〜 ㈣ . (9.14) 

dr „ 


上式,连同初始条件 (9.10), 是基本的向后微分方程组. 

这两组微分方程是由柯尔莫果洛夫(他奠定了马尔科夫过程 
理论的基础)首先导出的已经证明 1 >，这两组方程总存在一个 
公共解 { P «( r , Oh 它满足查普曼-柯尔莫果洛夫方程 （9.1) 且 


1) 见第442页脚注 1. 


» A6Q 



O >0, 2 0 < I . (915) 

k 

由纯增殖过程（第 4 节）可知， P ,/ r ， 0之和不必为1，差1 一 
/) 说明在有限的时间间隔0*，0中出现无限多个转移的 
可能性，如果 2 P ^( r , 0 = 1，.则解{心0, /)} 是唯一的，伹一般 
地说,不同的过程可以满足同一向前与向后方程(见第10节).从 
应用的观点来说，不等式 SP ^( r , 0 < 1的可能性可以放心地不 
予考虑. 

例.广义普阿松过程. 考虑所有 W 等于同一常数； I 且 
不依赖于£的情况.在这神情況中是一个通常马尔可夫链的 
转移概率，并且(如第十五章中那样)我们用表示它的高阶转 
移概率. 

由 cM = X 可以推出，在间隔+ A ) 中出现一个转移的 
概率不依赖于系统在吋刻 < 的状态且等于 AA + oQC ). 这蕴含在 
间隔 （ T ，*) 中的转移数具有参数为 lit - r ) 的普阿松分布.在 
已知恰 好有” 次转移出现的条件下，由/转移到々的(条件)概率 
为声以.因此 

. r. • 1 . 

以0, 0 = 一 -*) S r) " p\V (9.16) 

»=o n ! 

(这里，和通常一样，碑 =1, 当々时，说= 0).容易验证， 
( 9 .1 6 )事实上是两个微分方程组 （9.9) 与 （9.14) 满足边界条件 
(9.10) 的一组解. ： 

特别地，如果 

当々 < ;•时 M =0，当々 > 7•时^ = h - i ， 0.17) 
则（9.16〉化归为第十二章第1节中的复合普阿松分布. 

10. 病志过程 

纯增殖过程的例子(第 3 , 4 节)证明，由柯尔莫果洛夫微分方 
程所确定的转移概率 Py t (0 之和并不必须为1;如下情况是可能 
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发 生的: 


< 1 . ( 10 . 1 ) 

这种现象是1940年发现的，当时它是出人意料之外并使人蘿到麻 
烦的.大量的文献对它以及柯尔莫果洛夫微分方程并不总确定唯 
一的一组转移概率这一有关事实进行了硏究.具有这些性 
质的过程通常称为病态的 1 \后来认识到，此处的情况实际上是扩 
散理论中常见情况的一个简单而自然的类似，将有助于更好地理 
解这种现象. （10.1) 的出现不再使人感到麻烦，而是导致了柯尔 
莫果洛夫微分方程的理论与扩散理论具有相同的基本特征这一事 
实的发现.尽管基本方程及所用的分析工具的外貌完全不同，但 
在两种理论中我们遇到相同类型的边界条件及其 它一砦类似； 每 
种理论都可以借助另一个而更好地得到理解，因此在两者之间实 • 
际上不能划出鲜明的界线.在这方面马尔科夫过程理论已达到意 
想不到的和令人满意的内部统一. 

让我们重新考虑第3节 中的简 单增殖过程.系统在初始状态 
E 0 花费一些时间，然后从那里移动到 E ,， 在那里停一会儿，再移动 
到&，等等.在5。逗留的时间超过《的槪率？。(0可由 （3.2) 求 
出 ： PoCO = 这个逗留时间 T 。 是一随机变量，但它的值域 
是正 * 轴，所以超出了本书的范围.不过，由于从几何分布过渡到 
指数分布是平凡的，因此我们可以稍微越出这个范围而不必担心. 
用具有几何分布的离散随机交量来逼近 T 。 表明，用 

E ( T 0 ) = f te~ Xat dt = Ig 1 . (10.2) 

Jo 

来定义在的期望逗留时间是自然的.在系统进入冯的时刻， 
状态起着初始状态的作用，于是同样的论断适用于在&的逗 
留时间 T /: 在 E ; 的期望逗留时间 E ( T y ) = ly l . 由此可知 ， v + 
Af l + •-• 是系统经过 E 0 , R ， •••，所需的时间的期望 
值，我们可将第4节中的准则重述 如下： 


1) 在初版中本节的标题为“退化过程”, 


• 考位《 



^ P,M = 1 对一切 * 成立的充要条件是 

SE(T ; ) = = «>； (10 3) 

即在 E。， &，仏， ••• 所花费的总时间的期望值必须为无限.当 
然， L 0 O ) == 1 - EPXO 是系统在吋刻^以前已经过所有的状态 
的槪率. 

在这神形式中定理表面上是很合理的.如果在 E, 的期望逗 
留时间为 2_V 则系统在时间1 h 2- 1 + 2^ + • * • = 2中经过所' 
有的状态的概率必须为正.类似，沿*轴运动且速度按指数增加 
的质点在有限的时间内横过整个轴. 

如果用增殖过程作为总体增长的槙型，则状态 E„ 代表总体的 
实际大小《，而在有限的时间内达到无穷则表示一种爆炸.在这 
时 ) 确实代表一神异常现象，但对于其它的应用它却可以作 
为一种正常状态而出现.从几何上说，没有理由把态 E t ， &， 
E 2 ，… 置于 x 轴上的点0，1，2， …处. 设想 E,, 被置于^轴上 
的点 A 处，其中0 = < a < < .. • < • ' • II x „ -»■ 1. 于是 

增殖过程可用“质点”的运动来描述，这个质点从〜= 0出发，然 
后跳到一会儿后又跳到％等等.在这种描述中，经过所有伏 
态的质点已到达极限点1;这个事件在有限的吋间中出现是自然 
的.将槪率运动与从原点出发、在位置 x 处真有速度 /(*) 的质点 
的决定性运动相比较.它在时刻 * 的位置*(0满足微分方程 
^(0 = KxO )) 且到达点1的时间 r 为 


r 1 dx 


< 00 . 


(10.4) 


点1实际上能否在有限的时间_内到达(或仅仅渐近地趋近)依赖于 
速度倒数的积分的敛散性.在槪率模型中运动是跳跃式进行的， 
为由％ 到％ +1 所需的平均时间.从这个观点来看， （10.3) 与 
(10.4) 象是一对孪生准则. 

让我们继续考虑简单的增殖过程，并说明准则 （10.3) 怎样关 
系到柯尔莫果洛夫微分方程的唯一性问题. 

作为转移槪率来考虑•第3节中的 P„(/) 应当写为 P,„(0 .基 


. , 



本微分方程 （3 2) 同样适用于 P„(0> 其中是任意的(但是固定 
的）;于是我们有向前微分方程 

p ： ,0) = - Mt), 

P l aO ) = - ^ 00.5) 
其中； >0是固定的而々 = 1，2,….在 （8.4) 与 （8.5) 中我们 
有对应的向后方程 

PinO) = ~ + ^-iPi+ukCO} ( 10 . 6 〉 

其中々 > 0是固定的 ， i = 0, 1, 2, *... 初始条件显然为 

P,,(0) = 1， P,々(0) = o , (10.7) 

由 （10.5) 易知， P i0 (O 被第一个微分方程及边界条件 (10.7) 
唯一地确定.于是对于 A =1，2, •…， 我们能依次计算 P ik O ). 
如何解一阶线性方程是熟知的，对于向前方程 （10.5) 满足初始条 
件 (10.7) 的唯一解，我们有如下容易验证的 公式: 

PikO') = 0 ( 々 <»‘) ， PiiCf) = e~ l i' 

PikO ) = t* e -^ P^O - s ) ds s a>/). (10.8) 

Jo 

对于向后方程 (10.6) 情况完全不同.我们将证明，“当< 
oo 时解的唯一性不成立. 

引理. 由 do. 8 ) 给出的向前方程的唯 一解^ (0 自动满足向 
后方程 (10.6). 如果匕0)是 (10.6)—(10.7) 的任一非负解，则 
f P,>(0 > P/ 4 (0. (10.9) 

# 证.在 （10.6) 中，在所有的 P, 心）上面加上一条短线.第 》• 
个方程可以作为 P f -,« 的一个线性微分方程来解，我们得到 

== h ( e ~ l i s P i+l , K (t — s ) ds , i 

Jo • — 

PM = ^ +.^ [ 疒 V . P^o - s ) ds . (10.10) 
Jo 

[注意:这不是一组递推公式，因此不能用来解方程组 （10.6).] 

设 Pa ( 0 代表由 （10.8) 给出的向前方程的解.对于每个々 
及令 p iJt (0 - F,^C/) = 0. 这些函数满足 （10.10). 而且 
由（10_10)有 P == P ^(. 0 , 在 （10.10) 中依次令 / =» 


« 4^14 t 



々 一 1，々 一 2, • • •， 我们就对所有的 i 确定了 P „ W , 且它们是 
向后方程 (10.6) 满足初始条件 (10.7) 的一个解.显然= 
我们将用归纳法验证=心0).设当々一 
r (此处 r > 1是一整数)时这个等式成立(我们知道当 r == 1吋 
这个假设是成立的)，并令々一 / = r + 1. (10.10) 中的积分用 
Pi+Uk = p i + x ， k 来表示 戶 /. t ， 而（10. 8 )又将 P i+Uk 表示为包含 
的积分.于是可用 P i + UK - X 的二重积分来 
表示.颠倒积分次序我们得 * 

PikO') = ^^-1 ( e~ % k. x dx f e~ X!S P— x — s')is 

Jo Jo 

- =f* e-^P^it - x^dx. (10.11) 

JO 

根据归纳法假设 p^-M = p ； ,^ C 0, 将 dod ) 与 （ io . li ) 相比 
较即可证明？ .、0)=〜0). , 

剩下所要证明的是， (10.9) 对于向后方程 (10.6) 的任意解 
Pi k { t ) > 0成立.现在与 Pik . it ) 都满足 (10.10). 对于 
i > k 我们有 P >^ > P ,、0) 攻 0. 依次令/ = 々，々_ 1，々一 2, 
* ••即可证明 （10.9) 对所有的/，4成立，于是引理得证. 

分以下两种情况来讨论. 

( a ) SC == m 的情况.由第 4 节可知，在这种情况 
2 PuCo = i . 由此可知，向后方程的任何其它正解之和必大于 

而这是不容许的.因此在这种情况向前与向后方程的容许解 
都是唯一的.这个公共解表示増殖过程满足条件 S ~0) = 1的 
转移概率.（容易用微分法证明查普曼-柯尔莫果洛夫方程 （9.1) 
成立 .） 

( b ) SApcoo 的情况.我们知道，在这种情况有 SP^OX 

1. 于是 


L ， ( 0 == 1 —S〜 w ■ (10 - 12) 

为从民 出发、“无限性”在吋刻 f 之前达到的概率.我们知道， 
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p ik it) = p ,^(0 满足 （10.10)， 又通过求和我们看到 

LiiO ^ j — s)ds (10.13) 

或 

L ；.(0 = - X 山 (o + hLi^M L ;(0) = o . (10.14) 
在这种情况可以推出，无穷微分方程组 00.14) 具有满足条 
件 jL,(0) == 0 的非零解.对于任意的矩阵 • 

B ih CO = p ; ,(0 + LiOU^O (10.15) 

是向后方程 （10.6) 满足初始条件 （1 D .7) 的一个解 • 

现在的问题是能否确定使得成为满足查普曼- 
柯尔莫果洛夫方程 (9.1) 的转移概率，答案是肯定的.此处我们不 
准备证明这个论断但将给出一个概率解释. 

PqO ) 定义所谓吸收壁过程：当系统达到无穷时，过程终止. 
杜勃 [<8] 最先研究了一种返回过程，在其中，一旦到达无穷，系统立 
即回到 E 。 （或其它某个指定伏态)且过程从头开姶.在这种过程中 
系统由 E 。 到 E 5 可以经过五步或无穷多步.这个过程的转移概率 
具有 (10.5) 的形式.它们满足向后方程（10. 6 )，但不满足向前方 
程 （10.5). 

这说明为什么在向前方程的推导中我们不得不引入显得有些 
奇怪的假设了，它对于向后方程并不是必 需的： 在概率和直观上 
都简单的假设1一 2 是与返回过程相一致，对于这种过程向前方程 
不成立.换句话说，如果我们从假设 1-2 出发，则柯尔莫果洛夫 
向后方程成立，但对于向前方程则必须加上另一项 U . 

纯增殖过程太平凡，没有真正的趣眛，但这些条件对于柯尔莫 
果洛夫方程的最一般的情况是典 型的. 不过，有两个本质上的新 
现象出现.首先，增殖过程仅含有一条逸向“无穷”的路线，或用抽 
象的术语来说，一个单一的边界点.与此相对照，一般过程可能包 
含具有复杂拓扑结构的边界.第二，在增殖过程中，由于仅转移 


1) [55] 中给出了它的形式，在这篇论文中研究了_各种类型的过程及适当的边界条 

件. 
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E „ -> E n + l 为可能，故运动是指向边界的.能构造一个不同类型 
的过程；例如，可将方向颠倒而得到一个过程，在其中仅转移 
E n+l E „ 是可能的.这种过程不是在边界结束而是从那里发 
源.在生灭过程中，沿两个方向的转移都是可能的，正如在一维扩 
散中那样.在这种情况，存在与扩散理论中的弹性与反射壁过程 
相类似的过程，但它们的描述超出本书的范围. 

11.问题 


1. 在由 G .2) 定义的纯增殖过程中，对于所有的《令心>0.证明对于 
每个固定的 n 函数 P .( t ) 首先增加然后递威到 0. 如果~是极大值的位置， 
则心 <&<&<•••. 提示： 利用归纳法;微分 （3.2). 

2. (续 上). 如果 2 V = 00,试证明 <,-» oo . 提示：如果 
则对于固定的 * > T 序列增加.利用（ 4 .10). 

3. 尤尔过程.导出由 （3.4) 所定义的分布的均值与方差.[仅利用微 
分方程，而不用显式 （3.5).] 

4. 纯消亡过程.试求仅有由 E , 到& 的转移的尤尔型过程的微分方 
程. 试求分布 P .0) 及其均值与方差，假定初始伏态为 

5- 停车场 • 在一个有 N 个位置的停车场中来到的流是强度为1的普 
阿松型流，但仅当有空位置可以采用时是这样.试求怡有《个位置被占用的 
概率 P »(0 所满足歃分方程， 

6. 在排队中最后来到的顾客首先受到服务试求恰有《个新来者 
在随机选出的一个顾客的等_时间中受到服务的概率 P . C ») 所满足的微分 
方程. 

7 - 波里亚过程这是一个非平稳的纯增殖过程，其参数依赖于时 
间： . 

⑴. 1 ) 

试证明满足初始条件 Po ( Q ) = 1的解为 
f 0 (0 = (1 + ° 

P ,( t ) =，"(1 + at )--'/" -( i - + gll 1 + 2«)-.- {1 + (» - 1>}. (11 2 , 

/z J 

由微分方程证明均值与方差分别为，与/( I 十 W ). 

1 • 4^7 • 



8. (续上).波里亚过程能由第五章例 C 2.0 中的罐子模型取极限而 
得到.如果系统的状态定义为红球的数目，则在第 （《 + i ) 次抽取时的转移 
概率为 


Pk,u — 


r kc 
r 七 b 女 nc 


sat 


p 七 hr 
1 + nr 


9 


(11.3〉 


其中 P = r /(. r + 6 )> r = c /( r + b ), 

象由伯努利试验过渡到普阿松分布一样，设抽球以每 A 个时间单位一次 
的速度进行，并令 A — 0,《-»00使得《?-^, nr -^ at , 试证明在取极限 
时（ II . 3 )导致 （11.1). 并征明第五章的波里亚分布 (2-3) 化为 （11 . 2 ). 

9- 线性增长.如果在由（ 5 . 7 )定义的过程中又=0，厂（0) = 1,则 


仙)- TTI ? 


P . O ) 


(又0-， 

(1 + W + 1 . 


(11.4) 


最终灭绝的槪率为 U 

10. (续上).取 P ,(0 = A { t ) B -(/) 作为 (5.7) 的一个试探解，证明 
具有 IV (0) = 1 的解为 

p o (0 = m b (0> 

P . 0 ) = {1 - - (11.5) 

'. *-* 

其中 

B (0 = (11.6) 

n . (续上）.证明母函数 = 满足偏微分方程 

+ ( 11 . 7 ) 

12. (续上）.设)^(0 = ^ P .( t ) RW (0 = SnP H { t ) (如第5节中那 
样).证明 

K0) = 2(X - + (A + fi)M(t'). (11.8) 

证明当又 > ;» 时 {&} 的方差由 / 

- + p)/ ( 又 一 ju) (11.9) 

给出. 

13. 对于过程（7.2)母函数/^,0 = 满足偏微分方程 

^ (I — /) AP + (H.IO) 
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P = ■-卞 V , {1 _ (1 _ 

对于/ = 0 这是参数为; 1 (i _ 的普阿松分布.当00时，分布 

{?.(0> 趋向于参数为 Vp 的普何松分布 

14. 对于由 (7.26) 定义的过程母函数 P 0，<) = SP „( t )^ 满足偏微分 

方程 

(fi + Xs)^^, aXP t ( 11 . 11 ) 

它的~个解为.？ = {0* + 1)/(；1 + 幻}*. 、 ' 

15. 在“最简单的占线问题”例 7( a ) 中，令 0,0) 为系统从^出发，将 
在时刻*以前到达 E 。 的溉率.证明 0-(0 满足微分方程 

0«(0 = —( 又 + + Ae , +1 («) + nnQ _ x { t) i (« > 2), 

Ci (0 = —( 又 + ft ) Qi (0 + 久 02(0 + A * (11.12) 

及初始条件0»(0) = 0 . 

16. (续上）.对于由任意的一组向前方程所定义的过程考虑同一问 
题.证明 Q .0) 满足对应的向后方程(对于固定的其中心 (0 用1代替. 

17. 证明纯增殖过程的转移概率及生灭过程的转移概率都满足查普曼- 
柯尔莫果洛夫方程 （9.1). 

18. 设匕*(0满足査普曼-柯尔莫果洛夫方程（ 9 .1).设 Pi *( O >0 及 

s > o ) = 2 p <*(o 证明或者对于所有的 * 有 ^(o = 1或者对于所有 

k 

的 < 有&(0 < 1.. 

19. 遍历性质.考虑具有有限多个状态的稳定过程;即假定微分方程 
组 (9.9) 是有限的且 q 与 PM 为常数.证明解为指数项的线性组合， 
其中1的实部是负的，除非 A -0. 证明转移槪率的渐近性态和有限马尔科 
夫链中的情况一样,只是周期性情况是不存在的 •— 
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问题解答 

第+ —章 


1. 与尸 ( O . ' 

2. 0)(1 叫)，)； (b)(l 00(1 -sP(s)}/(l -0 ； 

(d) Po 广 1 + {1 - s->P( t )}/(l -s); (e)-l {P(s^) + 


3. U ( s ) « pqs 2 f(i — ps)(l — qs) t 均值 = 1 /^ 5 方差 =* (1 — 3辦）/ 

6. 一个零是第一、笫二、笫三、…个零，故 U )) 尸 Z ： F *(0. 

7. 母函数为 {1 一 ^))(1 - O '* «(1 + 种) • 

8- 母函数为2 {+ f (^)}* = 2 f (/) 厂 1 - 1. 


9. 相同的母函数. . ' 

10 •笫4个零必须在第> < «次试验中出现，而随后》_ >次试验不 
可产生一个零. 

11. 对于 ns ) < 1的情况利用显然类似于 （1.6) 的一个公式. 


12. 利用 X - 的几何分布的母函数，不需计算,我们有 


PrO ) 


/N — 1 W N-2\ / JV — r+i \ 

、— N _ s ) \ N — Is / … \N — (r — !>/ 


U. - (/- !>} - - 卜 I)' 


14. P r (0 


2 s 


N ' ™ (iV ― 1 N — (/V* — 2)^ 


N 


(N — r)s* 


15. S r 是具有共同的几何分布的 / 个独立随机变量之和 • 因此 




〒)’ ， P ,，* =《V 


r 4 - 々，一 1 


16 , P{R ==/*}== P{S f _i = P{Xc > v — 々 } 

k = o 


r . 

2^"^( 

k S n 、 


/* + 々一 
h 


\ p v - 
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E(R) = 1 + ^, var (R) = 


21 . w , * + 2 (々 2 1 其中 »« »• 1 , <U = 9 ，《 i = 分 , ， 


% = P 3 + ? 3 . 利用递推关系具有褶积形式这一事实，得 


U ( s ) 这 



O 、 3 

TT^Ty 




22. =* pu^i + 5 ^ 4 - =• 4- 夺《 、叫•因 

此 U(s) — 1 = p^(4-) + — + 和 • V(c); IV(s ') 爲 

psV(s) + qslV(s) 4 


第 十三章 

1. 只需证明对于汽 d = 1 的所有根$垆I我们有 Id > 1且仅有周 

期情況才可能有 M =i. , 

2 . u „ = D 2-卞〜 （咖) 十.因此仅当 r - 2时'是常返的.对 

于^=3数值积分的切线法给出 ' 

2 f (! ，〜； r *々 =(-|) 9/， « 

因此由 （3.5) «f 迟早要出现的概率近似为 * = 4- 和的一个更精确的估计 

3 

为 0.47, 因而得出 * = 0.J2. ' - 

3. 每当》= 4(« + 0时 S , == 0是可能的，二项分布表明 5 对于这样的 
» 我们有 H { S , = 0} ~ (« + by ^( lnabky /\ 级数发散. 

4 . 由％ + P { X , >0)^1 可以断定，除 P { X , > 0} « 0的情况外， 
恒有/ < I . 在这种情况，所有的 X * < 0且，或者在第一次试賤中出现或 
者永不出现. 

5• 设《 ” 3 U N 为已给且对于 » ^ N, «, = ?,«；_! + ?,«.-： + … 

+ 户 JV “* -N . 则 

“m « = u ' Pn + u i(pN 4 - Pn-i ) + ••- + »n(p, + p2 + + Pn) 

■ Pi *4 - 2 九十 3 p 3 + • • * ** 

如果 《* =* AT*% 则 j“n w, =» + 2« ? + ' • * + 

石 . ; + + I r(’），A p 2) (I 尸 ) 5=5 广 2 尸 *(’)• 
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7 . F,(0 =y + P . CO } - s-'FO). 

8. AW = {1- ^)}- 1 = y + |(I +0(1 一，，广 , 々• 这表明，在 

时刻 2 n 初过一个正点的槪率等于1/2即5„ = 0的槪率. . 

9. ( a ) F ( s ) = 和(1 — qs r )~ l 9 p = 1 4 - r ^** f 5 a z = ^ pg ^; fb ) 

”一 N ” E ( Z *) 〜 npqi^q 4* pr )~ l 9 var ( Z .) = nr 2 pq{q + pr )~* m 

10. U ( s ) = 1 + ^ + * * ■ + q r ~ l i r ~ l + g r s r (l — sy i 9 fi - 1 = q \ 

11- N *;=；( N ,- 714.3)/22.75； 0 ( y ) - 0 (- y ) ^ y • 

,12. r m = - i - r n ^ el + - i - r * 一，其中 = r i — r 2 5=3 1 > + 

4 * 8 

2^)(8 — 8^ + 2 ^ J - ■ f 3 )'" 1 ; r ,~ 1.444248(1.139680)-"-. 

. H . 如果〜 为一个长为 r 的』 连贯在第 《 次试验出现的概率，则在 
(7.5) 中以《代替 P , 以1 — «代替？即得 dO ). 设 B (>) 与 CO ) 分别为对 
应于 S 连赏与 C 連贯的函数.所 需的母 函数为= 1 -『心),其中在情 
况 （ a ) 中 U (0 = A ( s ); 在 （ b ) 中 U ( s ) = A ( s ) + 8(0 - 1;在 （ c ) 中 
V^s') = /(/)+■ + C(s) 一 2. 

15- 利用例 （8. b ) 与问题14中的方法的一个简单的结合. 

17. «» = 外 9 v *( oO ) = Npq k 9 

H 注意 1 — F ( s ) = (1 — s ) Q ( s ) 及 只 一 Q 0) = (1 一 s)R(s) 9 由此 
Q(l) - 2 及 （ I) = d p 十 〆 . 幂级数 Q-\s) — “ ，叫 )〆 当 

s = 1 时收敛. 

■■ ’ ..... 二 

第+四章 

1. 输光槪率仍然由（2.4)给出,其中户=<> [ (1 -0— ，9=利1 - 0". 
赌博的期望持续时间为 0,(1 - 0-,其中 D 2 由（ 3 .4)或 ( 3 . 5 ) 给出. 

2. 边界条件 (2.2) 被 - 5?, *= 1 - <5, ?. = 0来代替.对应于 (2.4) 
的解为 

*= {( A/py — (?/?)’}(1 — s ) - i - {{ q / py {\ — tf ) + Sq/p — l }. 

边界条件 （3.2) 成为 D 。 = 5 D 0 D 4 = 0. 

3- Gj = pq ,^ + 对应于 (2.1), 且如果 A = p 又 3 + <7 即 A . == 1 

或;^ + X = 扑 _1 , 则心 = P 是一个特解.输光概率为 
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1， 如果 g 

’ 一 y }*» 如 杲*? < 

5 - ^ z , n + i ( x ) ^ + qw 9 ^ Xtn { x )^ 边界条件为 （1) 似 o ， ji (^0 *=* 

« VkGO = 0(»>1)； (2) 对于 z ^ X 有《^,。(：*：) = 0且 w XiQ { x ) = 1. 

6 . 用浓 。,》(0 == … i ，》 C x ) R %,•(>) = ^a~-x t ni x ) 代簪 （ 1 ). 

00 

10. P { M ,< z } = 2 ("«-»,_ — ^«+ 2 ,») P { M . = z } = P { M ,<* + 1} — 
P(M. < z }. 

11. 初过无必须在时刻々 <” 出现，且质点在其 后”一 々步由 x 回到\ 

第十五章 - 

1 • P 的各行为0, ？，0, 0)， （0, L #7,分）， （ P , 9, 0, 0) 及（0, 0,夕， 
?)• 对于” > 1各行为（ 〆 ， M , My 9*). 

2. 00链是不可约的和周期的;对亍所有的；， —1/3. (注意 ，: p 
是二重随机矩阵 •> ( b ) 链具有周期？， G 包含 E , 与 E i ; 伏态 E , 构成 G ,, 
构成 我们有 u i — u i — 1/2> «3 = «4 = 1. C c ) 状态 与 构成一* 
个闭集艮与艮构成另一个闭集&是非常返的.对应于闭集的矩阵 
是以 I / 2 为元素的 2 X 2 矩阵.因此，如罘 E , 与 E * 属于同 一 S r ，则/ — 
1/2; P ^-^ O ； 最后，当々.= I ，3吋， p 5；>-»1/2, 当々= 2, 4,5时， — 
0. ( d ) 链的周期为 3. 令 (0, 0, 0, 1/3, 1)3, 1/3), 6 = (1, 0, 0 3 0, 
0,0), r = (0, 1/2, 1/2,0, 0, 0), 我们发现 ， P = P 5 = . • • 的各行为 a , 
b i b > c t e t f , P 5 = P * = ••- 的各行为 *， c , f , a , c , «, P = P " = ••• 的各 
行为 c, a, e， 〜〜之 

3- p；r - 0/6)*, p^V = ( K/ey - ((k - i)/ey (当々 > 0， 税 > = 0 
(当 々<》• 

4. x* i (3/4, 1/2, 1/4, 1/2), y* = (1/4, 1/2, 3/4, 1/2). 

5 . 令只 = Snp „ 如果 p = eo , 则状态是零 状态. 平稳 分布： «* = 
i*~ l (.Pk + i>lk+l + . . .)• 

7 . 当 S (1 — 9 o)(l — 9,) *•• (1 一 ?,_,) < 00时是遍历的.平稳分布 

与级数的项成比例， 一 

8- u " = [ phy {<! — p )! p . 

9. «,=■{!— p/^}(p/^y~ l -S' {1 — (p/rj)"}. 





10. Pi, <= 2i{ti - /)/^S Pi,i+i = ( N - 外，卜 1 = ; ! /W, «* 


• • • 0 0 

1 < 0 0 

o 1 • • • 0 0 


0 0 0 0 •. • 0 l I 

q p 0 0 ()oJ 

14. 注意矩阵是二重随机的;利用例 （ 6 . b ). 

15 •令 Pk.k^-1 = 1( 々 =1， •• .， N 一 1) ， Pn* = Pk, 

16. ☆，,*-=«*，于是 u (0 ='« o(i -0 ( p ( s ) - s }~ 1 . 遍历性的充 

要条件是 

23. 设 M 为 巧 的极大值.考虑状态 £ ，，其 中 A = M . 

26 . 如果 N > m - 2 , 则变量 X ( "» 与乂 (1) 是独立的，因此矩阵 Pik' ny 
的三行与 X ⑷的分布 (1/4, 1/2, 1/4) 恒等 • 对于« = «+?»三行为 
(1/2, 1/2,0), (1/4, 1/2, 1/4), (0, 1/2, 1/2). 

第+七章 

3. E(X) = h u i v.ir (X) = ie ll (e u - 1). 

, 4. T' m = — A « P , + A.(n +■ 1 )?*•+“ 

/ - 1〉卜** (”<*’). 

E(X) «■ »>-**； var(X) = - 疒 if ). 

5. P'(*) *= — (A + nil ) P«(0 + ^ Pn-M 十 （” + 1) M p »+i( ( ) w 
-1) 及 P ’ N (0 = - W + AP N - i ( # ). 

6 . 具有又 • ■= 又及 h =* M 的生灭过程. 

19. 解线微分方程的标准方法引出一组线性方程.参看第 417 页脚注 
中-的提示 • 
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